Claude Mythosとは何か——スペックと能力
Claude Mythos Previewは、Claude Opus 4.7(2026年4月リリース)を大幅に上回る性能を持つAnthropicの最新モデルだ。
Opus 4.7比で最も大きな改善が見られたのは、数学、長文脈推論、ソフトウェアエンジニアリング、そしてサイバーセキュリティの4領域だ。 最も注目すべきは「ゼロデイ脆弱性」の発見能力だ。
Anthropicによれば、Claude Mythosはリアルワールドのソフトウェアにおける未発見の脆弱性を特定・悪用する能力を持ち、発見された脆弱性の99%以上がまだパッチが当たっていないものだという。 これは、AIが初めて「ゼロデイ脆弱性をほぼ確実に発見できる」レベルに達したことを意味する。
Project Glasswing——「招待制のAI」という異例の設計
Claude Mythosは現在、「Project Glasswing」という枠組みの中でのみ利用可能だ。
Project Glasswingは、主要なテクノロジー企業や組織が自社の基盤ソフトウェアの脆弱性を発見・修正するためにMythosにアクセスできる招待制プログラムだ。 アクセスは防御的なサイバーセキュリティ目的に限定され、一般のAPI利用は不可だ。
Anthropicは「Claude Mythos Previewを一般公開する計画はないが、最終的な目標はMythosクラスのモデルを安全に大規模展開できるよう支援すること」と述べている。
11の企業・組織がProject Glasswingに参加しており、Google Cloud Vertex AIとAmazon Bedrockを通じた限定アクセスも提供されている。
なぜ公開しないのか——Anthropicの安全性判断
一般公開しないという判断は、AI産業史上でも異例だ。
通常、AIラボはより高性能なモデルを開発したら積極的に公開し、収益化を図る。 Anthropicはその王道から外れ、「このモデルは危険すぎる」という判断を下した。
その核心はサイバー兵器化リスクだ。 99%以上の精度でゼロデイ脆弱性を発見できるモデルが悪意ある主体の手に渡れば、世界中のインターネットインフラ、金融システム、重要インフラへの攻撃に使われる可能性がある。
Anthropicが10GWのコンピュート確保を進めるほどの計算資源を投じて開発したモデルを、あえて封印する——この判断にAnthropicの安全性哲学の本質が表れている。
AI研究者が注目する「能力と制御のギャップ」
AI研究コミュニティの間で、Claude Mythosは重要な議論の的になっている。
問題の核心は「能力と制御のギャップ(capability-control gap)」だ。 モデルの能力が研究者の制御能力を上回るペースで成長するとき、どこで「公開」の判断をするべきか。
Anthropicはそのラインを「ゼロデイ脆弱性の大規模発見能力」に引いた。 この基準が正しいかどうかは議論の余地があるが、「強力なモデルを封印する」という判断を公式に示した初のケースとして歴史的な意味を持つ。
英国Alan Turing Institute(CETAS)はClaude Mythosのサイバーセキュリティへのインプリケーションについてレポートをまとめており、「攻撃者と防御者の両方にとってゲームチェンジャーになり得る」と評価している。
「防御的利用のみ」は維持できるか
Project Glasswingの参加者はClaude Mythosを防御目的のみに使うことを約束している。
しかしAI研究者の間では、この「防御専用」という制限の実効性を疑問視する声もある。
脆弱性を発見する能力と脆弱性を悪用する能力は表裏一体だ。 「脆弱性を見つけるだけで攻撃はしない」という制限をAIに課しても、そのノウハウがどこかで漏れ出るリスクは排除できない。
さらに、Project Glasswingの参加企業が内部でどこまで情報を管理できるかという問題もある。
| リスク分類 | 内容 |
|---|---|
| 直接的悪用 | Mythosへのアクセス権を持つ者が攻撃に転用 |
| 間接的漏洩 | 発見された脆弱性情報が流出 |
| 国家レベルの模倣 | 他国がMythos相当のモデルを独自開発 |
| ディスティレーション | APIアクセスを使って類似モデルを学習 |
ホワイトハウスとの関係——連邦政府向けのMythos展開
4月後半、ホワイトハウスがAnthropicとの連邦政府向け合意の草案を作成していると報じられた。
政府機関がClaude Mythosにアクセスできるようにする枠組みで、防衛・諜報・インフラ保護での活用が想定されている。 これは「封印されたAI」が政府という形で実質的に「解放」されていくプロセスでもある。
ホワイトハウスがAIディスティレーション攻撃を告発した背景には、中国が米国のフロンティアAIモデルを使って同等の能力を獲得しようとしているという懸念がある。 Mythosが政府機関に配備されることは、その対抗措置としての性格を持つ。
AIの「核抑止」理論——持つが使わない戦略の登場
Claude Mythosの封印は、AI開発の新しい段階を示している。
「作れるが公開しない」「持っているが使わせない」——これは核抑止に似た戦略だ。 能力の存在は知られているが、その行使を厳重に制限することで、悪意ある主体への流出を防ぎながら防御側だけが恩恵を受ける設計を目指している。
AIの「核管理」という考え方が、2026年のAI安全保障の中心的なテーマになりつつある。 Anthropicの今回の決断は、その流れを加速させるだろう。
いつか「Mythosクラス」のモデルが誰でも使える日が来るとしたら、そのときの世界はどう変わっているだろうか。
ソース:
- Claude Mythos Preview — red.anthropic.com (2026-04-07)
- Why Anthropic won't release its new Mythos AI model to the public — NBC News
- Claude Mythos Preview on Vertex AI — Google Cloud Blog
- Claude Mythos: What Does Anthropic's New Model Mean for the Future of Cybersecurity? — Centre for Emerging Technology and Security
- Claude Mythos Preview — Amazon Bedrock