
2026年4月、Anthropicがサイバーセキュリティ能力を前面に打ち出した新モデル「Claude Mythos Preview」を発表しました。一般公開はされず、限定的なパートナー企業に防御目的でのみ提供されるという異例の形態です。報道や評価結果の数字が次々と流れる中で、「このモデルが企業ネットワーク侵入のどこまで自律でこなせるのか」という関心は急激に高まっています。
ただし、外部から飛んでくる「○○ステップを完了した」「○回中○回でゴールに到達した」といった単独の数字を見ても、それがどれくらい異質な達成なのかは判断できません。比較すべき過去モデルの数字、壁になっているフェーズ、評価環境そのものの構造、そして何より「ステップ」とは具体的に何を指すのか。これらの文脈なしには、報じられる能力評価は単なる印象論になってしまいます。
そんな中、新しい世代のAIエージェント能力を読み解く物差しとなる評価フレームワークが、Mythos Preview公開のわずか3週間前に、作られていました。32ステップに分解された企業ネットワーク侵入シミュレーションと、世代ごとの能力曲線。これを下敷きに、現在進行中のフロンティアモデル評価をどう解釈すべきかを整理します。