包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

Metaなどの研究者らは、RAGシステム...
Read More

人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでLlama-3などを評価した結果

現実のユーザーからの難しいクエリを使用し...
Read More

LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに

LLMは学習データに含まれる社会的な価値...
Read More

MMLUをアップデートしたベンチマーク『MMLU-Pro』Phi-3やLlama 3、Claude 3、GPT-4oなどの評価結果

LLMの性能が、様々な分野でどれほど進歩...
Read More

LLMで因果推論を行うためのプロンプト手法

因果推論とは、ある出来事が別の出来事にど...
Read More

論文

グラフニューラルネットワークを活用したRAG手法『GNN-RAG』 7BのLLMでも最先端性能
LLMで因果推論を行うためのプロンプト手法
LLMエージェントの認知バイアス
AGIへのロードマップ カーネギーメロン大学など複数機関からの研究グループが提唱
多くの「長いコンテキストを要するタスク」を、短いコンテキストウィンドウのLLMで解決する手法
時系列データの異常検知にLLMを使用する手法と実行プロンプト
自然言語プログラミングを可能にするシステム『CoRE』
LLMでプラグラム言語間の翻訳を行うプロンプト手法 C、Go→Rustのケーススタディ結果

業界/カテゴリー

PAGE TOP