LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLMプロジェクト開発に必要な新しい概念「AgentOps」とは

本記事では、LLMエージェントを安全に開...
Read More

画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど

本記事では、複数の文書やページから図や表...
Read More

LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける

本記事では、LLMの長文処理能力について...
Read More

「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ

本記事では、LLMの精度向上のために用い...
Read More

LLM

「LLMはプロンプトから新しいタスクを学べるのか?」 という根本的な問いに対する3つの仮説を検証
LLMベースの万能エンジニアを構築する『OpenDevin』プラットフォーム
LLMは人間のような「共感的な対話」ができるか?実行プロンプトと検証結果
Appleが「LLMエージェントの評価」に特化したベンチマーク『MMAU』を開発 5領域5能力で測る
LLMに専門的なドメイン知識を学ばせるのに有効な「読解タスクテキストに変換する」テクニック
LLMでASDを含む人間同士のコミュニケーションを支援するアプリケーション開発事例
RAGとLong-Contextの比較、そしてハイブリッドで活用する新しい方法
Among UsのようなゲームでLLMエージェントはどれほど活躍できるか
PAGE TOP