数千件のゼロデイ脆弱性を自律発見する能力
Claude Mythos Previewは汎用の大規模言語モデルとして開発されたが、セキュリティ分野で突出した能力を示した。同モデルはOpenBSD、FFmpeg、FreeBSDにおけるメモリ破壊の脆弱性や、暗号化ライブラリとWebアプリケーションのロジックバグを単独で特定した。クローズドソースのソフトウェアに対してもリバースエンジニアリングを通じて未知の欠陥を発見しており、その件数は数千件に上るという。
さらに同モデルは、JITヒープスプレーによるブラウザサンドボックスの脱出や、複数パケットにまたがるROP(Return-Oriented Programming)チェーンを用いたリモートコード実行など、高度な多段階エクスプロイトを自律的に構築できることも確認された。Anthropicの報告書は、前世代モデルのOpus 4.6と比較して「別次元の性能」と表現している。
一般公開を断念し「Project Glasswing」を設立
Anthropicは商業的な利益よりもリスク管理を優先し、Mythos Previewの一般公開を見送ると決定した。悪意ある第三者がこの能力を悪用するリスクが大きすぎると判断したためだ。
その代わりに同社は「Project Glasswing」を立ち上げた。マイクロソフト、アップル、アマゾン、グーグルなど主要テクノロジー企業に限定的なアクセスを提供し、攻撃者が同等の能力を持つ前に脆弱性の修正を進める枠組みだ。クリティカルインフラの運営者やオープンソース開発者にも段階的にアクセスを拡大する方針で、「守備側」が先に活用できる環境をつくることを目指している。
米政府との係争と安全優先の判断
Anthropicは現在、米政府から「サプライチェーンリスク」として指定されることへの異議申し立てを裁判所で争っており、一定の司法的支持を得ている。今回の公開凍結の判断は、軍事・監視目的への技術利用に強く反対する同社の立場と一致する。
批評家の一部は、今回の決定が安全性への責任ある姿勢を印象づけながらも、政府との法廷闘争を有利に進めるための戦略的なポジショニングでもあると指摘する。いずれにせよ、高度なAI能力の公開を自主的に制限した今回のケースは、AIガバナンスをめぐる議論に新たな論点を提供することになりそうだ。
ソース:
・Fail Safe: Why Anthropic won't release its new AI model — RTE News(2026年4月12日)
・Claude Mythos Preview — Anthropic Red Team Report