LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLMプロジェクト開発に必要な新しい概念「AgentOps」とは

本記事では、LLMエージェントを安全に開...
Read More

画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど

本記事では、複数の文書やページから図や表...
Read More

LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける

本記事では、LLMの長文処理能力について...
Read More

「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ

本記事では、LLMの精度向上のために用い...
Read More

投稿者の過去記事

OpenAIがGPT-4oの評価を発表。音声性能が高く、それゆえのリスクも
「LLMはプロンプトから新しいタスクを学べるのか?」 という根本的な問いに対する3つの仮説を検証
漫画を台本に変換するモデル『Magi v2』オックスフォード大学の研究グループが開発
LLMベースの万能エンジニアを構築する『OpenDevin』プラットフォーム
LLMは人間のような「共感的な対話」ができるか?実行プロンプトと検証結果
画像と「動画」の中にあるものを認識する『SAM 2(Segment Anything 2)』をMetaが開発
Appleが「LLMエージェントの評価」に特化したベンチマーク『MMAU』を開発 5領域5能力で測る
LLMに専門的なドメイン知識を学ばせるのに有効な「読解タスクテキストに変換する」テクニック
PAGE TOP