AIDB Daily Papers
SVR-MAD:事後確率誘導型マルチエージェント討論のためのベイズ的フレームワーク
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- LLMエージェントの精度向上に寄与するマルチエージェント討論(MAD)の文脈成長問題を解決するフレームワークを提案した。
- 従来の事前情報に頼る手法とは異なり、討論結果を事後確率的証拠としてエージェントの正誤を推定する点が新規である。
- 提案手法は、トークンコストを最大61%削減しつつ、既存の最先端手法と同等以上の精度を達成した。
Abstract
Multi-Agent Debate (MAD) improves LLM-agent accuracy but suffers from rapid context growth, limiting scalability in larger multi-agent settings. Existing methods prune low-utility communications using prior signals, such as token-level log-likelihoods or LLM self-reported confidence. However, these signals become unreliable under hallucination, degrading the accuracy of MAD methods that rely on them. We propose SVR-MAD, a Bayesian-inspired MAD framework that treats pre-debate signals as priors and debate outcomes as posterior-style evidence for estimating agent correctness. SVR-MAD uses this evidence to incrementally construct the communication graph, prioritizing agents whose answers survive peer challenges. Experiments across multiple LLMs and benchmarks show that SVR-MAD reduces token cost by up to 61% while matching or improving accuracy relative to the most accurate competing MAD baseline.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: