AIDB Daily Papers
PhantomSkill:AIエージェントのスキルエコシステムにおける悪意あるコード注入
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- AIエージェントのスキルエコシステムにおける新たなサプライチェーン攻撃手法「PhantomSkill」を提案した。
- 悪意あるコードを直接記述せず、脆弱性を悪用する形で隠蔽することで、検出を回避する点が重要である。
- この手法は、既存のスキルに悪意ある動作を埋め込みつつ、検出率を低下させることを実証した。
Abstract
Agent skills allow LLM-based coding agents to acquire domain-specific capabilities from third-party packages, but they also introduce a new supply-chain attack surface. We present PhantomSkill, an attack framework that hides malicious behavior in a skill's auxiliary resources rather than in its textual description. Its core technique, VulMask, rewrites overt malicious scripts into vulnerability-shaped implementations whose malicious behavior is activated only under attacker-controlled trigger conditions. This design shifts the visible signal from explicit malicious intent to ordinary-looking insecure code. Across representative host skills, attack goals, coding agents, generation models, and automated reviewers, VulMask preserves benign utility while reducing warning and malware-level detection compared with overt malicious scripts. Our results show that skill ecosystems require resource-level vetting, execution-time containment, and security policies that treat exploitable vulnerabilities in agent skills as potential malicious payloads.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: