AIDB Daily Papers
子エージェントの継承:マルチエージェントネットワークにおけるサブエージェント生成のモデリングと悪用
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 本研究は、マルチエージェントネットワークにおけるサブエージェントの生成と継承に着目し、そのセキュリティリスクを分析した。
- LLMエージェントが普及する中、親エージェントの悪意ある指示や状態がサブエージェントに継承されることで、ネットワーク全体にセキュリティ侵害が広がる新たな脅威を明らかにした。
- 既存のフレームワークにおけるメモリ継承、リソース制御、状態管理、終了権限の脆弱性を実証し、明示的なセキュリティ不変量に基づく防御策を提案した。
Abstract
Since the official release of ChatGPT in 2022, large language models (LLMs) have rapidly evolved from chatbot-style interfaces into agentic systems that can delegate work through tools and newly spawned subagents. While these capabilities improve automation and scalability, they also pose new security risks in multi-agent networks. Existing research has studied how individual LLM-based agents can be compromised through prompt injection, jailbreaking, poisoned retrieval data, or malicious extensions. Less is known about what happens after one agent is compromised inside a multi-agent network. In particular, inherited memory from parent agents can carry malicious instructions, outdated states, or unintended behavioral rules into newly created subagents, allowing a local compromise to spread across agent boundaries. In this paper, we model contemporary multi-agent networks through the lens of subagent inheritance. Our analysis shows that current frameworks can violate trust boundaries through insecure memory inheritance, weak resource control, stale post-spawn state, and improper termination authority. We demonstrate these risks in real agent frameworks and propose defenses based on explicit security invariants. Our findings show that inheritance is not merely an implementation detail, but a central component influencing the security of multi-agent systems.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: