メディアパートナー各社

次回の更新記事:Cursorはソフトウェア開発を加速する?導入後の実態…(公開予定日:2025年11月11日)

RAGシステムの最適な構築を探る
LLMエージェントの評価はLLM単体の評価と大きく異なる
LLMの小規模化と高性能化を両立させた『Gemma 2』Google DeepMindが発表
LLMにおける通説への提言
LLMはRAGコンテキストと事前知識のどちらに依存する?
RAGにおいて長文を検索することで一気に効率を上げるアプローチ『LongRAG』
LLMにハイレベルな問題の解決アプローチを自分で考えさせるエージェント化手法「SelfGoal」
タスクを一度視覚化して取り組ませることで、LLMの推論能力を大きく向上させるプロンプト手法『Whiteboard-of-Thought(ホワイトボード思考法)』
ロングコンテキストはRAGもText to SQLも解決するか Googleがケーススタディを実施
オープンソースモデルでも力を合わせれば先端モデルに匹敵することを示す「Mixture-of-Agents(MoA)」アーキテクチャ
現実世界の確率分布における言語モデルの推定能力と改善方法 Googleが検証
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その3 プロンプトエンジニアリングのケーススタディ〜
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その2 マルチモーダルとエージェント〜
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その1 重要な用語と各種プロンプト手法〜
包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

メディアパートナー各社

PAGE TOP