LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLMプロジェクト開発に必要な新しい概念「AgentOps」とは

本記事では、LLMエージェントを安全に開...
Read More

画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど

本記事では、複数の文書やページから図や表...
Read More

LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける

本記事では、LLMの長文処理能力について...
Read More

「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ

本記事では、LLMの精度向上のために用い...
Read More

論文

Self-Reflection(自己反省)がLLMのパフォーマンスに与える影響を網羅的に調査
100人以上の研究者が実験参加 LLMは人間より優れた研究アイデアを思いつくのか?
LLMの推論能力を戦略的に向上させる新しいプロンプト手法『SCoT』
AIコーディング補助ツール(GitHub Copilot)で開発者の生産性が26%向上 Microsoft・アクセンチュアなど3社の大規模調査結果
マルチモーダルLLMの高難易度ベンチマーク『MMMU-Pro』で明らかになったこと
ロングコンテキストLLM台頭の今もRAGを使用する理由
RAGの検索データにおける「ノイズ(事実とは異なる情報など)」には有益なノイズと有害なノイズがある
RAGの検索精度を実務レベルに高めるには、「情報ごとに ”質問文” を作りデータベースに入れる」のが効果的との報告
PAGE TOP