今回の合意に参加した主要AIラボ
| 企業 | 合意の種類 | 主なモデル |
|---|---|---|
| Google DeepMind | 新規締結 | Gemini系 |
| Microsoft | 新規締結 | Azure AI系 |
| xAI | 新規締結 | Grok系 |
| OpenAI | 既存協定を再交渉・更新 | GPT系 |
| Anthropic | 既存協定を再交渉・更新 | Claude系 |
モデルを「公開前に政府へ提供」する仕組み
今回の協定の核心は、各社が新しいフロンティアモデルを一般公開する前に、政府側に提供して評価を受ける点にある。
CAISIは評価結果に基づき、「公開前評価」と「公開後調査」の2段階でモデルの能力と安全保障リスクを分析する。特筆すべきは、評価の精度を高めるために、開発者側が安全フィルター(ガードレール)を一部取り除いた状態のモデルを提供する点だ。通常の公開バージョンでは検知しにくい危険な挙動や、悪用可能な能力をあぶり出すことが目的である。
CAISIのクリス・フォール所長は「フロンティアAIとその安全保障上の意味を理解するためには、独立した厳密な測定科学が不可欠だ」とコメントした。Microsoftは「予期しない挙動を徹底的に調べる方法で、米国の科学者と協力する」と声明を出し、共有データセットや評価ワークフローを政府と共同で開発していく方針を示している。
評価には省庁横断の専門家チーム「TRAINSタスクフォース」も参加し、AIのサイバー安全保障リスクや軍事転用可能性について多角的に分析する体制をとる。CAISIは現時点で40件以上の評価を完了しており、一般に未公開の最先端モデルの評価も含まれている。
合意拡大の背景にある「Mythosモデル問題」
今回の合意拡大が急ピッチで進んだ背景には、Anthropicが発表した「Claude Mythos Preview」の存在がある。同モデルは32ステップに及ぶエンドツーエンドのサイバー攻撃シーケンスを自律的にクリアできることが判明し、政府の安全保障関係者に強い警戒感を与えた。
フロンティアAIがサイバー攻撃のツールとして実際に機能し得ることが示されたことで、「公開前に政府がモデル能力を把握する仕組み」の整備が急務となった。CAISIは2024年からOpenAIおよびAnthropicと個別の評価協定を結んでいたが、今回Google DeepMind・Microsoft・xAIが加わったことで評価対象は一気に主要5社へと拡大した。
また、この発表より数日前には国防総省がGoogle・Microsoft・AWS・Nvidia・OpenAI・SpaceXなど7社との間で、AIを機密ネットワークに展開する協定を別途締結していた。AIの軍事・安全保障領域への組み込みが急速に進むなかで、政府側も評価と監視の仕組みを整備しようとする動きが加速している。
「自発的」合意がデファクトスタンダードへ
注目すべきは、今回の協定がいずれも法的義務のない「自発的」な取り組みに基づく点だ。それにもかかわらず、競合する5社すべてが公開前評価プロセスに参加するという状況は、業界における事実上の標準(デファクトスタンダード)が形成されつつあることを示している。
トランプ政権が2026年2月に打ち出したAIアクションプランは、過剰規制よりも「安全保障との共存」を基調としており、今回の協定もその路線に沿ったものといえる。Microsoftが英国のAI安全保障研究所(AISI)とも類似協定を締結していることは、こうしたモデル評価の枠組みが国際的にも広がりつつあることを示唆する。
一方で、評価の実効性については課題も残る。ガードレールを取り除いたモデルを政府が評価すれば安全という論理には、評価プロセスの透明性や、評価後の公開可否判断の基準をどう設けるかという問いが伴う。AIの能力が急速に高まるなかで、公開前評価という仕組みは本当に「ガードレール」として機能し得るのか。今後の運用と情報開示のあり方が問われることになる。
ソース:
- CAISI Signs Agreements Regarding Frontier AI National Security Testing — NIST(2026年5月5日)
- Microsoft, Google and xAI to give US government early access to AI models for security checks — AP/KELO(2026年5月5日)
- Google, Microsoft, and xAI agree to let US government test AI models before public release — Yahoo News(2026年5月5日)
- Microsoft, Google, xAI give US access to AI models for security testing — Al Jazeera(2026年5月5日)