現実世界の確率分布における言語モデルの推定能力と改善方法 Googleが検証

LLMが確率分布を理解し、確率推定を行う...
Read More

包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

Metaなどの研究者らは、RAGシステム...
Read More

人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでClaude 3などを評価した結果

現実のユーザーからの難しいクエリを使用し...
Read More

LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに

LLMは学習データに含まれる社会的な価値...
Read More

LLM

AGIへのロードマップ カーネギーメロン大学など複数機関からの研究グループが提唱
多くの「長いコンテキストを要するタスク」を、短いコンテキストウィンドウのLLMで解決する手法
時系列データの異常検知にLLMを使用する手法と実行プロンプト
自然言語プログラミングを可能にするシステム『CoRE』
LLMでプラグラム言語間の翻訳を行うプロンプト手法 C、Go→Rustのケーススタディ結果
LLMエージェントの設計16パターン 
ファインチューニングがLLMの幻覚(ハルシネーション)に与える影響 Googleなどによる検証結果
GPT-4o、Gemini、Claude 3などにおける「長いプロンプトのマルチモーダルタスク」性能を測定した結果

業界/カテゴリー

PAGE TOP