最新の記事:LLMを「イノベーション」に活かす 応用可能性と戦略…

投稿者の過去記事

LLMの小規模化と高性能化を両立させた『Gemma 2』Google DeepMindが発表
LLMにおける通説への提言
LLMはRAGコンテキストと事前知識のどちらに依存する?
RAGにおいて長文を検索することで一気に効率を上げるアプローチ『LongRAG』
LLMにハイレベルな問題の解決アプローチを自分で考えさせるエージェント化手法「SelfGoal」
タスクを一度視覚化して取り組ませることで、LLMの推論能力を大きく向上させるプロンプト手法『Whiteboard-of-Thought(ホワイトボード思考法)』
ロングコンテキストはRAGもText to SQLも解決するか Googleがケーススタディを実施
オープンソースモデルでも力を合わせれば先端モデルに匹敵することを示す「Mixture-of-Agents(MoA)」アーキテクチャ
現実世界の確率分布における言語モデルの推定能力と改善方法 Googleが検証
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その3 プロンプトエンジニアリングのケーススタディ〜
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その2 マルチモーダルとエージェント〜
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その1 重要な用語と各種プロンプト手法〜
包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発
人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでClaude 3などを評価した結果
LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP