AIDB Daily Papers
AIエージェントの行動を保険で管理する:実行時保険数理制御のための権威フロンティアフレームワーク
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- AIエージェントが起こすデータベース変更や支払いなどの副作用を伴う行動に対し、安全なデフォルト値との比較で価格設定し、予算内で実行を制御するインターフェースを提案した。
- この研究は、AIエージェントの実行時におけるリスク管理と権威の解放度を定量化する新しい評価フレームワークを提示する点で重要である。
- 提案手法は、多様な行動を統一的に評価し、異なる環境で一貫した低予算時の拒否パターンを示し、モデルごとのリスク許容度の違いを明らかにした。
Abstract
Autonomous AI agents increasingly issue side-effect-bearing actions: database mutations, refunds, payments, external commitments. We propose the Actuarial Action Interface (AAI), a deterministic runtime contract that prices each such action against a contractually fixed safe default under a time-consistent risk mapping, and gates execution against a per-boundary reserve capital budget. We then develop the Authority Frontier, an evaluation primitive measuring how much autonomous authority the runtime releases at each level of reserve capital. The framework provides (i) a deterministic quote-bind-commit protocol with toll-bounded capability tokens; (ii) a universal seven-class action taxonomy mapping heterogeneous tool calls to comparable authority units; (iii) replay determinism and pathwise reserve coverage under alpha-spending; (iv) cross-domain normalization via full reserve demand C_full and capital metrics Capital@k. We instantiate AAI across four agentic environments (database mutation, customer-service refund, and the public tau-bench retail and airline tool-use traces) and report a live Postgres panel in which three Azure-hosted models propose actions through the same contract. The frontier exhibits a common low-reserve refusal and intermediate-release pattern across domains, with saturation only where the budget grid reaches full reserve demand; required reserve capital varies by 22x (Capital@50 from 289 to 6457). The framework does not force domains into the same shape; it surfaces each domain's actuarial geometry. In the live panel the contract prevents realized loss across all three models at low budget while differing in underwriting persistence under denial: model identity is an actuarial underwriting variable. The contribution is a benchmark-ready evaluation framework for runtime actuarial control of autonomous-agent side effects.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: