
中身はまったく同じAIモデルが、2つの名前で世に出ました。ひとつは誰でも使える一般提供版、もうひとつは審査を通過した組織だけが使える版です。分かれた理由は性能ではなく、安全対策の有無にあります。
話題の主は、Anthropicが新たに公開したClaude Fable 5とClaude Mythos 5です。評価レポートには、ベンチマークの記録だけでなく、テスト中であることに気づくモデルの様子や、人間のエンジニアにはまだ及ばないと判断された具体的な場面まで、率直な観察が並んでいます。
本記事では、その内容から、Claudeを業務で使う人が押さえておきたいポイントを整理して紹介します。