AIDB Daily Papers
APEX:AIエージェントの自己進化を加速する適応的原理抽出フレームワーク
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 本研究では、AIエージェントが自身のプロンプト、ワークフロー、意思決定ルールを経験に基づいて自己改善するAPEXフレームワークを提案した。
- 既存手法がプロンプトのみを最適化するのに対し、APEXはプロンプト、行動原理、ワークフロー構造の3層を同時に進化させる点で新規性がある。
- APEXは、実運用AIエージェントにおいて、ベースラインを大幅に上回る性能向上と、再利用可能な6つの新規原理の抽出、そして研究初のワークフロー構造の選択を達成した。
Abstract
Self-improvement in AI agents has emerged as a key research frontier: systems that modify their own prompts, workflows, and decision rules based on accumulated operational experience. The state-of-the-art Self-Harness framework [1] achieves 14--21% improvement on Terminal-Bench-2.0 by mining failure clusters and patching the agent harness. However, Self-Harness optimises only one dimension -- the prompt harness -- leaving behavioural principles and workflow topology unchanged. We propose APEX (Adaptive Principle EXtraction), a three-layer co-evolution framework that simultaneously evolves: (L1) the harness via failure-mode patching, (L2) behavioural principles via success-trace distillation [2], and (L3) the agent workflow topology via structural fitness-based selection [6]. We implement APEX on Joe [13], a production-grade super AI Agent built on NVIDIA Nemotron and designed as an Edge AI Agent Factory for the NVIDIA Agent Challenge 2026, managing a 15-node compute fleet using 114 real task traces collected over 18 days. APEX achieves an APEX Health Score of 0.570 (+90% vs. baseline 0.300) in a single evolutionary run, distilling 6 novel reusable principles and selecting a research-first workflow topology scoring 0.900 (+20%). Our results demonstrate that multi-dimensional co-evolution substantially outperforms single-axis harness optimisation, at a cost of only 4 LLM calls (~270 s) on a local qwen2.5-coder:32b instance.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: