AIDB Daily Papers
LLMエージェントのための、効率的で正確な実行可能スキル「Formal Skill」
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- LLMエージェントが現実世界で信頼性の高い行動をとるために、再利用可能な能力をJSONメタデータとPython実行可能ファイルで表現する「Formal Skill」を提案しました。
- この研究は、従来の自然言語によるスキル表現の非効率性と不確実性を克服し、トークン効率と実行制御を大幅に向上させる点で重要です。
- 提案手法は、ベンチマークテストにおいて競争力のあるスコアを達成し、特にスキルが重要な役割を果たすタスクで優れた結果を示しました。
Abstract
Large Language Model (LLM) agents increasingly act inside real workspaces, where tools and skills determine whether model reasoning becomes reliable action. Existing skills remain largely informal: Markdown skills and instruction packs encode procedures as long natural-language documents, while function calling, Model Context Protocol (MCP) servers, and framework tools structure individual actions but usually leave workflow state, policy enforcement, and completion discipline outside the skill itself. We introduce Formal Skill, a runtime-native abstraction that represents reusable capability with JSON metadata and action schemas, reliable Python executors, hook-governed control logic, Formal Skill routing, and skill-local runtime state. By moving reusable procedure from repeated prompt text into executable state machines and hook policies, Formal Skill gives agents a token-efficient and enforceable control surface. We implement the abstraction in FairyClaw, an open-source event-driven runtime for executable, observable, and composable Formal Skills. On Harness-Bench, FairyClaw obtains highly competitive average scores while using substantially fewer tokens, with especially strong results on tasks that expose the role of Formal Skill.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: