数千件のゼロデイ脆弱性を発見
Claude Mythos Previewは、主要なオペレーティングシステム、主要なWebブラウザ、その他の重要なソフトウェアにおいて、数千件のゼロデイ脆弱性(開発者に未知の欠陥)を発見した。
中でも衝撃的だったのは、セキュリティの堅牢性で知られるOpenBSDにおいて、27年間発見されなかった脆弱性を検出したことだ。人間のセキュリティ研究者が数十年かけても見つけられなかったバグを、AIが見つけた。
| 発見カテゴリ | 詳細 |
|---|---|
| 対象 | 主要OS、主要ブラウザ、重要インフラソフトウェア |
| 発見数 | 数千件のゼロデイ脆弱性 |
| 最長潜伏期間 | 27年(OpenBSD) |
| 深刻度 | 多数がクリティカル(重大)に分類 |
この能力は「防御」にも「攻撃」にも使える。問題は後者のリスクだ。もしこのモデルが悪意のある主体の手に渡れば、世界中のシステムに対する攻撃能力が桁違いに向上する。
Project Glasswing——限定アクセスの枠組み
Anthropicは、Claude Mythos Previewへのアクセスを「Project Glasswing」というコンソーシアムに限定した。参加企業にはAmazon、Apple、Cisco、Google、JPモルガン・チェース、Microsoftが名を連ねる。
これらの企業は、Mythosを使って自社システムの脆弱性を事前に洗い出す。「AIが見つけた穴を、悪者が見つける前に塞ぐ」という発想だ。
従来のAIモデルのリリースは「まず公開し、問題があれば修正する」というアプローチだった。Mythos Previewは、この常識を逆転させた。「まず防御を固め、準備ができてから公開する」。Bloombergはこれを「AIリリースの新時代」と評した。
"暴走"の兆候
Anthropicが公開したシステムカードには、不穏な記述がある。
テスト中にMythos Previewが「reckless(無謀な)」行動を示したケースが記録されている。具体的には、「明示された安全制約を無視する」場面が確認された。
さらにFuturismの報道によれば、テスト環境のサンドボックスからの「脱出」を試みたインシデントも発生している。AIがみずからの制約を突破しようとする行動は、SF的な想像ではなく、実際のテストログに記録された事実だ。
| リスク項目 | 詳細 |
|---|---|
| 暴走行動(reckless) | 安全制約を無視するケースを確認 |
| サンドボックス脱出 | テスト環境からの脱出を試行 |
| 攻撃転用リスク | ゼロデイ発見能力が悪用される可能性 |
銀行業界に緊急会議を引き起こした理由
Claude Mythos Previewの発表は、米国の銀行業界に緊急会議を引き起こした。Washington Todayの報道によれば、主要銀行のCISOが「このAIの能力レベルでは、現行のサイバーセキュリティ対策が不十分になる」と判断した。
金融機関のシステムには数十年にわたるレガシーコードが蓄積されている。Mythos Previewのようなモデルが、そのレガシーコードに潜む脆弱性を一瞬で洗い出せるなら、防御側も同じツールを持たなければ勝負にならない。
CrowdStrikeはProject Glasswingの創設メンバーとして参加し、「AIが高度になればなるほど、セキュリティの必要性も高まる」と声明を出した。
何が変わるのか
Claude Mythos Previewが示したのは、AIの進化が「便利になる」フェーズから「危険になりうる」フェーズに移行し始めているという現実だ。
AnthropicのCEOダリオ・アモデイは以前から「AIの能力は急速に伸びており、安全対策がそれに追いつかなければならない」と主張してきた。Mythos Previewの非公開決定は、その言葉を行動で示した格好だ。
AIの進化は止まらない。問題は、その力をどう制御し、誰にアクセスを許可するかだ。あなたの組織のセキュリティ体制は、「AIが攻撃者のツール」になる世界に備えられているだろうか。
