ロングコンテキストはRAGもText to SQLも解決するか Googleがケーススタディを実施

ロングコンテキストのLLMは、単体でも多...
Read More

現実世界の確率分布における言語モデルの推定能力と改善方法 Googleが検証

LLMが確率分布を理解し、確率推定を行う...
Read More

包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

Metaなどの研究者らは、RAGシステム...
Read More

人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでClaude 3などを評価した結果

現実のユーザーからの難しいクエリを使用し...
Read More

LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに

LLMは学習データに含まれる社会的な価値...
Read More

論文

「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する
約1.7万件におよぶLLM論文を調査した結果からわかる現在のLLM研究トレンド arXiv運営のコーネル大より発表
人間とGPT-4の社会的知能を測定するツール『SOTOPIA』登場 GPT-4は秘密を守る力で人間より優れるとの結果も
従来の小さなニューラルネットワークでも「メタ学習」でChatGPTを凌駕するほど高度な生成AIができるとの報告、Nature誌
GPT-4などLLMのコード生成能力にデバッグ機能を追加する『SELF-DEBUGGING(セルフデバッギング)』と実行プロンプト
LLMに非線形的な思考を与えてCoTを上回る性能を引き出す手法『IEP』と実行プロンプト CoTと組合せでさらに強力になる場合も
Natureなどの論文約4,800本でGPT-4による査読能力が検証され、「LLMは査読にも有用」と結論
DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか?OpenAIが論文で発表

業界/カテゴリー

PAGE TOP