AIDB Daily Papers
TraceScope:対話型URLトリアージのための分離型チェックリスト判定
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- インタラクティブな操作を必要とする高度なフィッシングサイトを検知するため、新しいURLトリアージ手法を提案した。
- 本研究は、サンドボックス化されたエージェントがブラウザを操作し、LLMの限界を超えて証拠を照会することで、安全かつ再現性の高い分析を実現する。
- 実世界のフィッシングサイトに対する評価では、既存手法を大幅に上回る精度と再現性を達成し、高度な攻撃を検出することに成功した。
Abstract
Modern phishing campaigns increasingly evade snapshot-based URL classifiers using interaction gates (e.g., checkbox/slider challenges), delayed content rendering, and logo-less credential harvesters. This shifts URL triage from static classification toward an interactive forensics task: an analyst must actively navigate the page while isolating themselves from potential runtime exploits. We present TraceScope, a decoupled triage pipeline that operationalizes this workflow at scale. To prevent the observer effect and ensure safety, a sandboxed operator agent drives a real GUI browser guided by visual motivation to elicit page behavior, freezing the session into an immutable evidence bundle. Separately, an adjudicator agent circumvents LLM context limitations by querying evidence on demand to verify a MITRE ATT&CK checklist, and generates an audit-ready report with extracted indicators of compromise (IOCs) and a final verdict. Evaluated on 708 reachable URLs from existing dataset (241 verified phishing from PhishTank and 467 benign from Tranco-derived crawling), TraceScope achieves 0.94 precision and 0.78 recall, substantially improving recall over three prior visual/reference-based classifiers while producing reproducible, analyst-grade evidence suitable for review. More importantly, we manually curated a dataset of real-world phishing emails to evaluate our system in a practical setting. Our evaluation reveals that TraceScope demonstrates superior performance in a real-world scenario as well, successfully detecting sophisticated phishing attempts that current state-of-the-art defenses fail to identify.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: