LLMを「評価者」として活用する『LLM-as-a-judge』の基本

本記事では、新たな評価手法として注目され...
Read More

Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)

本記事では、視覚と言語を組み合わせたマル...
Read More

LLMによるバグ全自動修正に成功するケースと失敗するケースの違い

本記事では、LLMによるバグ修正に関する...
Read More

LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLMプロジェクト開発に必要な新しい概念「AgentOps」とは

本記事では、LLMエージェントを安全に開...
Read More

画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど

本記事では、複数の文書やページから図や表...
Read More

LLM

100個の事例を分析して明らかになったLLM-RAGアプリケーション「19の欠陥パターン」
エージェントなしで行うLLMによるソフトウェアのバグ修正手法
心の理論をLLMエージェントに実装することの効果
競争環境でのLLMエージェントが自発的に協力し始める現象を観測
LLMの「頑固な知識」を変えることができるコンテキスト内編集手法(中国科学院大学Baolong Bi氏)
NVIDIAが教えるRAGチャットボット実装の重要ポイント
複数LLM協調アプローチ「マージング」「アンサンブル」「協力」について
10億人のペルソナ(人物像)で多様な合成データを作成するための技術
PAGE TOP