次回の更新記事:コンパクトでも冴える頭脳 会話評価、数理探索、そし…(公開予定日:2025年11月15日)

記事スタイル

LLMにおける通説への提言
LLMはRAGコンテキストと事前知識のどちらに依存する?
RAGにおいて長文を検索することで一気に効率を上げるアプローチ『LongRAG』
LLMにハイレベルな問題の解決アプローチを自分で考えさせるエージェント化手法「SelfGoal」
タスクを一度視覚化して取り組ませることで、LLMの推論能力を大きく向上させるプロンプト手法『Whiteboard-of-Thought(ホワイトボード思考法)』
ロングコンテキストはRAGもText to SQLも解決するか Googleがケーススタディを実施
オープンソースモデルでも力を合わせれば先端モデルに匹敵することを示す「Mixture-of-Agents(MoA)」アーキテクチャ
現実世界の確率分布における言語モデルの推定能力と改善方法 Googleが検証
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その3 プロンプトエンジニアリングのケーススタディ〜
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その2 マルチモーダルとエージェント〜
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その1 重要な用語と各種プロンプト手法〜
包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発
人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでClaude 3などを評価した結果
LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに
マルチモーダルLLMは従来手法よりゼロショット画像分類の精度が大幅に向上 Googleが報告

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP