この記事でわかること
- Anthropicは新型「Claude Mythos Preview」の一般公開を断念すると発表した
- 主要OSやブラウザに数千件のゼロデイ脆弱性を自律発見・悪用できる能力が判明したため
- 「Project Glasswing」でMS・Apple・Amazon・Googleなど守備側に限定アクセス提供
- Responsible Scaling PolicyのASL-3が初めて実運用された大型事例として記録される
AIスタートアップのAnthropicは2026年4月12日、新たに開発した大規模言語モデル「Claude Mythos Preview」を一般公開しないと発表した。同モデルが主要オペレーティングシステムやブラウザに存在する未発見の脆弱性を大量に自律的に発見・悪用できると判明したためだ。安全性を優先した今回の判断は、AI能力の急激な拡張とリスク管理のバランスをめぐる業界全体の議論を呼んでいる。
数千件のゼロデイ脆弱性を自律発見する能力
Claude Mythos Previewは汎用の大規模言語モデルとして開発されたが、セキュリティ分野で突出した能力を示した。同モデルはOpenBSD、FFmpeg、FreeBSDにおけるメモリ破壊の脆弱性や、暗号化ライブラリとWebアプリケーションのロジックバグを単独で特定した。クローズドソースのソフトウェアに対してもリバースエンジニアリングを通じて未知の欠陥を発見しており、その件数は数千件に上るという。
さらに同モデルは、JITヒープスプレーによるブラウザサンドボックスの脱出や、複数パケットにまたがるROP(Return-Oriented Programming)チェーンを用いたリモートコード実行など、高度な多段階エクスプロイトを自律的に構築できることも確認された。Anthropicの報告書は、前世代モデルのOpus 4.6と比較して「別次元の性能」と表現している。
一般公開を断念し「Project Glasswing」を設立
Anthropicは商業的な利益よりもリスク管理を優先し、Mythos Previewの一般公開を見送ると決定した。悪意ある第三者がこの能力を悪用するリスクが大きすぎると判断したためだ。
その代わりに同社は「Project Glasswing」を立ち上げた。マイクロソフト、アップル、アマゾン、グーグルなど主要テクノロジー企業に限定的なアクセスを提供し、攻撃者が同等の能力を持つ前に脆弱性の修正を進める枠組みだ。クリティカルインフラの運営者やオープンソース開発者にも段階的にアクセスを拡大する方針で、「守備側」が先に活用できる環境をつくることを目指している。
米政府との係争と安全優先の判断
Anthropicは現在、米政府から「サプライチェーンリスク」として指定されることへの異議申し立てを裁判所で争っており、一定の司法的支持を得ている。今回の公開凍結の判断は、軍事・監視目的への技術利用に強く反対する同社の立場と一致する。
批評家の一部は、今回の決定が安全性への責任ある姿勢を印象づけながらも、政府との法廷闘争を有利に進めるための戦略的なポジショニングでもあると指摘する。いずれにせよ、高度なAI能力の公開を自主的に制限した今回のケースは、AIガバナンスをめぐる議論に新たな論点を提供することになりそうだ。
ソース:
・Fail Safe: Why Anthropic won't release its new AI model — RTE News(2026年4月12日)
・Claude Mythos Preview — Anthropic Red Team Report
なぜ Anthropic は公開を止めたのか
| 観点 | 概要 |
|---|---|
| 検出能力の想定超過 | 事前評価では「一部の既知脆弱性の再発見」程度と想定されていた |
| 悪用コードの自動生成 | 検出に加え、PoCエクスプロイトを自動で組み立てるケースが観測された |
| レッドチームの所要時間 | 想定の3倍以上のテストが必要と判断された |
| ガードレールの限界 | 一部のジェイルブレイクに対する耐性が不十分だった |
一般公開を断念したという意思決定は、モデルの能力そのものではなく、公開による社会的コストとの釣り合いが取れていないという判断に基づく。
Responsible Scaling Policy との整合
Anthropic は数年前から、能力レベルごとに公開条件を段階的に引き上げる Responsible Scaling Policy を打ち出してきた。 今回の Claude Mythos Preview の扱いは、その枠組みが「実際に作動した初の大型事例」と位置付けられる。
| ステージ | 要求される対応 |
|---|---|
| ASL-2 | 標準的な悪用対策 |
| ASL-3 | CBRN・サイバーの深刻な悪用リスクへの追加対策 |
| ASL-4 | 自律的行動能力に対する封じ込め |
今回のモデルは ASL-3 相当の判断が下されたと関係者は説明している。
競合他社への波及
OpenAI、Google DeepMind、Meta は、いずれも類似能力のモデル評価を進めており、Anthropic の判断は業界全体の線引きに影響を与える可能性が高い。 特に以下の論点が業界内で議論され始めている。 - 脆弱性発見モデルを「防御側にのみ」提供する仕組みをどう担保するか - APIアクセスの契約書に、サイバー攻撃用途を明示的に禁止する条項を入れるか - モデルの「能力の公開」と「モデル重みの公開」を分離できるか
ユーザー視点で変わること
| ユーザー層 | 影響 |
|---|---|
| 一般開発者 | Claude への期待値の再調整が必要 |
| セキュリティ研究者 | 制限付きアクセスの申請プロセスが整備される見込み |
| エンタープライズ顧客 | 新モデルのリリースロードマップ全体が遅延する可能性 |
| 規制当局 | AI安全性評価の新しい参照点を得る |
今後の見通し
Anthropic は同モデルを「研究者向けの制限アクセス」として限定公開する方針を示唆している。 公開断念は、AI業界にとって「フロンティアモデルの能力が社会的受容能力を超え始めた瞬間」を象徴する可能性がある。 安全性と能力のトレードオフを、企業単独で引き受けるべきなのか。 あるいは、国際的な枠組みに持ち込むべきなのか。 この問いは、2026年中にさらに強く問われることになる。
コミュニティからの反応
Anthropic の公開断念に対しては、AI 研究コミュニティから賛否両方の反応が出ている。
| 立場 | 主な主張 |
|---|---|
| 安全性擁護派 | 責任ある判断であり、他社も追随すべき |
| オープン推進派 | セキュリティ研究が遅れる懸念 |
| 中立派 | 限定アクセスのデザインが実効性を決める |
同じ能力のモデルを他社がフルに公開する可能性も残っており、業界としての足並みがそろうかどうかが次の焦点となる。
政策的な波及
米国ではAI安全性の大統領令、EUではAI法(AI Act)の適用が段階的に進んでおり、今回の判断はこれらの枠組みに実例として参照される可能性が高い。 特に「モデル能力の閾値を超えた場合、公開前に政府通知を義務づけるか」の議論に直接接続する。 AIの自律的サイバー能力は、もはや技術の問題ではなく、国家安全保障の問題へと移行しつつある。
日本企業が取るべき構え
| 職種 | 備え |
|---|---|
| CISO・セキュリティ責任者 | AI由来の攻撃シナリオをプレイブックに組み込む |
| 法務 | AI利用規約の例外条項を精査 |
| 開発チーム | 依存ライブラリの脆弱性監視を自動化 |
| 経営層 | AI由来のインシデントに対する事業継続計画を更新 |
Claude Mythos のような強力な検出モデルは、防御側にとっても有用だ。 アクセスできる立場を得たら、自社のインフラを先回りで点検するのが最も合理的な使い方になる。
AIと社会の臨界点
Claude Mythos Preview の公開断念は、単一企業の一事例を超えて、AI業界全体が臨界点に近づいていることを示している。 フロンティアモデルの能力は、もはや個別の企業の判断だけでは制御しきれない領域に入りつつあり、国際的な枠組みの必要性が現実味を帯びてきた。 一方で、過度な制限はイノベーションを止め、悪意ある利用を地下化させるリスクも抱える。 どの線を、誰が、どの手続きで引くのか。 2026年は、AIのガバナンスという抽象的な議論が、具体的な制度設計に落ちていく年になるだろう。
よくある質問(FAQ)
Q. Anthropicはなぜ商業公開を諦めたのか?
事前評価を超え、PoCエクスプロイトの自動生成や JITヒープスプレーによるブラウザサンドボックス脱出まで観測されたため。レッドチームが想定の3倍以上の時間を要し、ガードレールも不十分と判断された。
Q. 他社が同等能力のモデルをフルに公開する可能性はあるか?
OpenAI・Google DeepMind・Metaも類似モデルを評価中で、足並みが揃うかは未確定。脆弱性発見モデルを「防御側のみ」に提供する仕組みや、能力公開と重み公開の分離が業界の論点になっている。
Q. 日本企業のCISOは何を準備すべきか?
AI由来の攻撃シナリオをプレイブックに組み込み、依存ライブラリの脆弱性監視を自動化する。法務はAI利用規約の例外条項を精査し、経営層はAIインシデント前提のBCPに更新するのが現実的。
よくある質問
Q1. なぜ公開を断念したのか?
Claude Mythos PreviewがOpenBSD・FFmpeg・FreeBSDなど主要OSやブラウザに数千件のゼロデイ脆弱性を自律発見・悪用できる能力を持つと判明したためだ。Anthropicは商業利益よりリスク管理を優先し、2026年4月12日に一般公開の見送りを発表した。
Q2. Project Glasswingとは?
Anthropicが立ち上げた限定アクセス枠組みだ。マイクロソフト、アップル、アマゾン、グーグルなど主要テック企業や、クリティカルインフラ運営者、オープンソース開発者に段階的にアクセスを提供する。攻撃側より先に守備側が活用できる環境づくりを狙う。
Q3. 何が「別次元」の性能か?
JITヒープスプレーによるブラウザサンドボックス脱出、複数パケットにまたがるROPチェーンを用いたリモートコード実行を自律的に構築できる点だ。Anthropicの報告書は前世代Opus 4.6と比べて「別次元」と表現した。Responsible Scaling PolicyのASL-3初の実運用事例となる。
## 関連記事 - [Claude(クロード)の料金プラン完全比較|Free・Pro・Max・API の違いと選び方【2026年最新】](/articles/10000196) - [AIコーディングエージェント徹底比較|Claude Code・Cursor・Devin・Copilot・Windsurf——2026年の最適解は](/articles/10000212) - [BtoB、BtoCの次は「BtoA」。AIエージェントに商品を買ってもらう時代が来た](/articles/10000338)

