AIDB Daily Papers
スキルが増えるとエージェントは性能低下? スキルシャドーイングがライブラリ拡張時のパフォーマンスを低下させる
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- LLMエージェントがタスク固有の指示をオンデマンドで読み込むスキルライブラリにおいて、ライブラリが大きくなるとパフォーマンスが低下する現象を調査した。
- このパフォーマンス低下は、エージェントが間違ったスキルを選択する「スキルシャドーイング」と、コンテキストの増加による「コンテキストオーバーヘッド」に起因することを分析した。
- 実験の結果、スキル選択の失敗であるスキルシャドーイングがパフォーマンス低下の主な原因であり、コンテキストオーバーヘッドの影響は小さいことが明らかになった。
Abstract
Skill libraries allow LLM agents to load task-specific instructions on demand, letting non-expert users solve domain-specific tasks through natural language without knowing which skills exist or how they work. However, performance degrades as libraries grow -- by up to 21% when scaling from a small set of helpful skills to a 202-skill library. In this work, we formulate this performance degradation as the pass rate drop between loading a library of known-helpful skills and the full library. Moreover, we propose to decompose the pass rate drop by conditioning on the skill(s) invocation -- which skills the agent selects during a trajectory -- into two effects: emph{skill shadowing}, where the agent selects wrong skills more often as the library expands, and emph{context overhead}, where the enlarged context degrades execution even when selection is correct. We derive upper bounds on both effects to characterize their magnitudes of impacts to the pass rate drop. Our empirical estimates of the effects and their upper bounds both show that the emph{skill shadowing} effect grows with library size and significantly contributes to the performance degradation, whereas the emph{context overhead} effect remains small and indistinguishable from zero. This observed asymmetry establishes that the skill selection failure, not the enlarged context, is the primary bottleneck when expanding the skill libraries.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: