包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

Metaなどの研究者らは、RAGシステム...
Read More

人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでLlama-3などを評価した結果

現実のユーザーからの難しいクエリを使用し...
Read More

LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに

LLMは学習データに含まれる社会的な価値...
Read More

MMLUをアップデートしたベンチマーク『MMLU-Pro』Phi-3やLlama 3、Claude 3、GPT-4oなどの評価結果

LLMの性能が、様々な分野でどれほど進歩...
Read More

LLMで因果推論を行うためのプロンプト手法

因果推論とは、ある出来事が別の出来事にど...
Read More

教育・キャリア

ChatGPTは学術論文の文章スタイルをどう変えているか?大規模な調査の結果
人間のカリキュラム教育のような学習でLLMの性能は向上するとの報告
GPT-4を使用した知的労働者のパフォーマンスは軒並み向上し、もとの成績が良くないほど顕著。※注意点あり
CLARIFY DELPHI:人間の道徳的な判断を質問生成でサポートするAI
大規模言語モデルと抽象言語オブジェクトでデジタルネイチャーを目指す
ChatGPTが今度は「物理学」で実力を見せる
セールスフォース、論文の要約AIを開発。【AI×教育】(論文解説)
サイトビジット社、「AIによる試験問題の予想・作成システム」で特許出願

業界/カテゴリー

PAGE TOP