AIDB Daily Papers
自律AIエージェントのためのライフサイクルセキュリティアーキテクチャ「AgentWard」
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 自律AIエージェントのライフサイクル全体にわたるセキュリティアーキテクチャ「AgentWard」を提案した。
- この研究は、AIエージェントのセキュリティ障害が複数の段階に波及する問題に対処し、重要な資産を保護する。
- AgentWardは、5つの保護レイヤーとクロスレイヤー連携により、脅威を効果的に遮断し、実行を封じ込める。
Abstract
Autonomous AI agents extend large language models into full runtime systems that load skills, ingest external content, maintain memory, plan multi-step actions, and invoke privileged tools. In such systems, security failures rarely remain confined to a single interface; instead, they can propagate across initialization, input processing, memory, decision-making, and execution, often becoming apparent only when harmful effects materialize in the environment. This paper presents AgentWard, a lifecycle-oriented, defense-in-depth architecture that systematically organizes protection across these five stages. AgentWard integrates stage-specific, heterogeneous controls with cross-layer coordination, enabling threats to be intercepted along their propagation paths while safeguarding critical assets. We detail the design rationale and architecture of five coordinated protection layers, and implement a plugin-native prototype on OpenClaw to demonstrate practical feasibility. This perspective provides a concrete blueprint for structuring runtime security controls, managing trust propagation, and enforcing execution containment in autonomous AI agents. Our code is available at https://github.com/FIND-Lab/AgentWard .
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: