ロングコンテキストはRAGもText to SQLも解決するか Googleがケーススタディを実施

ロングコンテキストのLLMは、単体でも多...
Read More

現実世界の確率分布における言語モデルの推定能力と改善方法 Googleが検証

LLMが確率分布を理解し、確率推定を行う...
Read More

包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

Metaなどの研究者らは、RAGシステム...
Read More

人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでClaude 3などを評価した結果

現実のユーザーからの難しいクエリを使用し...
Read More

LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに

LLMは学習データに含まれる社会的な価値...
Read More

プロンプト

LLMのプロンプトに数百から数千の例を含める超長尺のコンテキスト内学習(In-context learning)とファインチューニングの性能比較
LLMに対して、「人間には意味が分からない滅茶苦茶な文」でプロンプトを送る手法『LM Babel』
LLMでWikipediaのような文書を作成する方法「STORM」スタンフォード大学研究者ら開発
プロンプトでLLMにRPAワークフローを自動生成させる手法「FlowMind」JPモルガン考案
LLMにおける、長いコンテキストから欲しい情報を見つけ出す「needle-in-a-haystack(干し草の中の針)」テスト結果とプロンプト例
プロンプトに例を多く載せるほど、どんなタスクでも性能が上がるのか?DeepMindによる『Many-shot Learning』の実験結果
LLMが思考のネットワークを構築し、人間の推論プロセスを模倣する『THOUGHTSCULPT』プロンプティング
LLMに心の目を与える『Visualization-of-Thought』プロンプティング マルチモーダルモデルに匹敵する空間推論性能を達成

業界/カテゴリー

PAGE TOP