何が起きたのか
グーグルは5月19日、Gemini 3.5 Flashを発表した。同日から、世界中のGeminiアプリとGoogle検索の「AIモード」で初期設定のモデルになった。Flashは従来から、速度と低コストを売りにした小型系統の名前である。今回はそこに、上位モデル並みの知能を載せた。グーグルはこれを、最前線の知能と「行動する力」を組み合わせた最初のモデルと位置づけた。
性能の数字が、その性格を物語る。グーグルによれば、3.5 Flashはコーディングやエージェント(自律的にタスクをこなすAI)の難しいベンチマークで、上位の「Gemini 3.1 Pro」を上回った。Terminal-Bench 2.1で76.2%、GDPval-AAで1656 Elo、MCP Atlasで83.6%。しかもコストは3.1 Proより40%安く、応答速度は4倍に達した。性能を上げながら、価格と速度を改善する。小型モデルが上位モデルを置き換える構図である。
第三者の評価指標でも、その位置は際立つ。独立系の評価サービス「Artificial Analysis」の指標では、3.5 Flashは知能と速度の両方が高い右上の領域に入った。品質と応答の速さは引き換えだという常識を、数字の上で崩した形である。これまでは、賢いモデルは遅く高く、速いモデルは性能を諦める、という棲み分けがあった。3.5 Flashは、その境界を押し広げた。
注目すべきは、最上位の「Gemini 3.5 Pro」の投入が見送られた点だ。最大級のモデルをぶつけて性能の頂点を取りにいく従来のやり方を、グーグルは今回選ばなかった。代わりに、より速く安いFlashを前面に出した。頂点のモデルを誇示するより、数十億人の手元で動くモデルを優先する。発表の構成そのものに、戦略が表れている。
I/Oで発表されたのはモデルだけではない。検索ボックスは刷新され、短い検索語にも、チャット風の長い対話にも応じる形に変わった。短い問いには素早く答え、込み入った相談には対話で応じる。一つの入り口が、二つの使い方を兼ねる設計である。YouTubeには「Ask YouTube」が加わった。質問すると、料理の手順や水回りの修理といったテキストの答えと、関連する動画へのリンクの両方が返る。このほかAndroid XRグラス、音声や映像を扱う「Gemini Omni」、開発支援の「Gemini Spark」など、製品全体にAIを織り込む発表が並んだ。グーグルが公開した発表項目は100件に及んだ。
発表の幅の広さは、グーグルの狙いを映す。単体のモデルの性能を誇るのではなく、検索、動画、端末、開発環境まで、生活と仕事のあらゆる接点にAIを差し込む。一つの賢いモデルを、無数の入り口から使ってもらう。製品の総量で勝負する構えである。利用者にとっては、特別なアプリを開かなくても、いつもの道具の中でAIに触れることになる。AIが意識せずに使う前提になれば、どのモデルが動いているかは、もはや問われなくなる。
なぜ「最大」ではなく「最速」なのか
グーグルの判断の背後には、推論コストの問題がある。大型のモデルは賢いが、動かすたびに多くの計算資源を食う。検索やGmail、YouTubeのように、数十億人が日々使う製品に常時組み込むには、重すぎてコストが見合わない。
ここに、AI事業の現実がある。研究のデモでは最大のモデルが目を引く。だが製品に載せて利益を出すには、安く速く動くモデルが要る。性能の高さと、配備のしやすさは別の問題である。どれだけ賢くても、採算が合わなければ事業は続かない。AIの開発競争は、研究の競争であると同時に、コストの競争でもある。グーグルは検索という巨大な製品基盤を持つ。だからこそ、製品に載る効率を性能の頂点より優先した。
この発想は、AI競争の評価軸を変える。これまでは「どのモデルがベンチマークで最高点か」が話題の中心だった。しかし、点数で1位でも、コストが高くて製品に載らなければ、ユーザーには届かない。性能が横並びに近づいた今、勝敗は「どれだけ安く、速く、広く届けられるか」へ移りつつある。
ここにグーグルの強みがある。同社は検索、Gmail、地図、YouTube、Androidといった、世界で数十億人が使う製品を抱える。安く速いモデルを作れば、それを既存の製品にそのまま流し込める。配る場所を最初から持っている企業にとって、効率の高いモデルは即座に膨大な利用へつながる。最大のモデルで研究の頂点を取るより、製品に載るモデルで日常を押さえる。グーグルが選んだのは、自社の地の利を生かす道である。
背景:これまでの経緯
グーグルはここ2年、I/Oをほぼ「AI一色」にしてきた。検索という同社の収益基盤に、生成AIをどう組み込むかが最大のテーマである。検索市場ではChatGPTのような対話型サービスが台頭し、ユーザーの問いの立て方そのものが変わってきた。短い検索語を打つのではなく、AIに相談する。この変化は、検索広告で稼ぐグーグルの土台を揺らしかねない。自社の収益源を脅かす技術に、自社の手で対応する。グーグルが抱えるのは、こうしたジレンマである。検索を守るために、検索を作り替える。グーグルは検索ボックスを対話に開きつつ、自社のGeminiを軸に据えることで主導権を守ろうとしている。
開発競争の構図も変わった。これまでは、より大きなモデル、より高いベンチマークスコアが評価の軸だった。しかし大型モデルは推論コストが高く、数十億人が使う製品に常時載せるには重すぎる。グーグルが今回示したのは、最前線の知能を保ちつつ、製品に展開できる軽さを優先するという方針である。Axiosはこの選択を、ベンチマークの頂点だけを追うのではなく、安く速いモデルを大規模に配備する戦略だと整理した。
ライバルも動いている。OpenAIは企業向けのAI導入を加速するため、新会社「OpenAI Deployment Company」を立ち上げた。40億ドル超の初期投資を背景に、企業に技術者を派遣して導入を支援する。AIコンサルティングのTomoroも買収し、約150人の技術者を取り込んだ。モデルを売るだけでなく、導入まで伴走する。企業市場の取り合いが激しさを増している。
一方アンソロピックは、自社の上位モデル「Mythos」がサイバー防御の弱点を見つける能力を持つと公表し、米政府内に懸念を広げた。ホワイトハウスはMythosへのアクセス拡大に反対したと報じられている。攻撃にも防御にも使える能力を、どこまで広く配るか。AIの能力が上がるほど、この問いは重くなる。
同社はまた、外部のエージェントツールでClaudeを使う際の利用制限と上限を導入した。自律的なAIの作業がもたらす計算コストの重さが、その背景にある。エージェントは便利だが、裏では多くの計算を回す。コストが利用に追いつかなければ、提供する側は制限をかけざるをえない。一部の利用者は反発し、OpenAIは競合サービスの無料枠で利用者を呼び込もうとした。エージェントの普及は、技術だけでなく、コストの問題でもある。
OpenAIはさらに、防御目的のサイバーセキュリティに特化したモデルを欧州企業に開放した。ドイツテレコムやBBVAなどが、安全装置を備えたモデルを使えるようになる。各社は、汎用の賢さだけでなく、用途を絞った提供でも競い始めている。汎用モデルの性能が横並びに近づくほど、特定の業務に最適化した形での差別化が重みを増す。
世界トップメディアの見立て
Axios(5月21日付)は、グーグル・OpenAI・アンソロピックの幹部がそろって、最前線の競争は「ほぼ互角」だと語っていると伝えた。各社はコスト・速度・計算資源をめぐって異なる賭けに出ており、優劣は単純なスコアでは測れない段階に入ったという見立てである。誰かが頭一つ抜けるのではなく、似た性能のモデルが別々の強みで競う。横並びの競争は、価格と配備力の勝負を呼ぶ。
MarkTechPost(5月20日付)は、3.5 Flashを「エージェントとコーディング向けの、より速く安いモデル」と位置づけ、上位モデルを置き換えうる性能と価格のバランスを評価した。開発者にとっては、安く速いモデルでエージェントを組めることの意味が大きい。試作のハードルが下がり、実験の回数を増やせる。MacRumors(5月19日付)は、Gemini 3.5に加え、AI検索、Android XRグラスを今年のI/Oの柱として整理し、グーグルが製品全体をAIで再設計しつつあると報じた。一つの目玉発表ではなく、製品群の総入れ替えに近い。報道はその規模感を伝えている。
規制をめぐる動きも見逃せない。グーグルとマイクロソフトは、OpenAI・アンソロピックに続き、米商務省の「AI標準・革新センター(CAISI)」による公開前のモデル審査を受け入れた。ハッキング能力や軍事転用、想定外の挙動を、配備前に政府が点検する枠組みである。最前線のモデルが社会に与える影響が大きくなるにつれ、開発と監督の距離は縮まっている。複数の報道が一致して指摘するのは、AIが製品から「社会の基盤」へ変わりつつあるという点である。
整理すると、競争は三つの層で同時に進んでいる。一つ目は、モデルそのものの性能と効率である。グーグルのFlashは、この層で効率の旗を立てた。二つ目は、企業への導入をめぐる争いだ。OpenAIが技術者派遣に踏み込み、アンソロピックと顧客を奪い合う。モデルを売って終わりではなく、使いこなしまで支える競争に移っている。三つ目は、規制と安全性の層である。サイバー能力の扱いをめぐり、政府の関与が深まっている。三つの層のどこで強みを持つかが、各社の立ち位置を決める。一社がすべての層で勝つのは難しい。だからこそ、各社の戦略の違いが、これからの構図を形づくる。
数字で見る
主要モデルのエージェント性能(MCP Atlas)と、3.5 Flashの位置づけを整理する。
| 指標 | 数値 | 補足 |
|---|---|---|
| MCP Atlas(Gemini 3.5 Flash) | 83.6% | 上位の3.1 Proを上回る |
| MCP Atlas(Claude Opus 4.7) | 79.1% | アンソロピックの上位モデル |
| MCP Atlas(GPT-5.5) | 77.8% | OpenAIの主力モデル |
| Terminal-Bench 2.1 | 76.2% | コーディング系の指標 |
| GDPval-AA | 1656 Elo | 実務タスクの評価 |
| コスト | 3.1 Pro比 40%減 | 価格効率 |
| 速度 | 約4倍 | 応答の速さ |
| 発表項目 | 100件 | I/O 2026全体 |
| 配備状況 | 世界で初期設定化 | Geminiアプリ・AIモード |
数字が示すのは、小型モデルが上位モデルの性能に追いつきつつ、コストと速度で大きく上回る局面である。性能の差が縮まれば、競争の軸は価格と展開力へ移る。MCP Atlasの数字では、3.5 Flashが競合の上位モデルを上回った。小型でありながら、各社の主力に並ぶ。この逆転が、効率重視の戦略を支えている。
「行動するAI」の意味
グーグルは3.5 Flashを、知能と「行動」を組み合わせたモデルと説明した。ここでいう行動とは、エージェントの働きを指す。質問に答えるだけでなく、複数の手順を自分で進め、ツールを操作してタスクを完了する。MCP AtlasやTerminal-Benchで高い数字を出したのは、こうした自律的な作業の能力が高いことを意味する。
エージェントが実務で広がるには、二つの条件が要る。一つは精度だ。任せた作業を間違えずにこなせなければ、人が結局やり直すことになる。手間が増えれば、任せる意味が薄れる。もう一つはコストである。エージェントは一つのタスクで何度もモデルを呼ぶ。一回あたりが高ければ、まとまった作業を任せると費用がかさむ。3.5 Flashが価格と速度を改善したのは、この二つ目の条件に効く。安く速く動くほど、エージェントに任せられる作業の幅は広がる。コストが下がれば、これまで人が担っていた定型の作業を、AIに移す判断もしやすくなる。
アンソロピックがエージェント利用に上限を設けたのも、同じコストの問題の裏返しである。便利さと費用は表裏一体だ。グーグルが効率を前面に出した背景には、エージェント時代のコスト競争を見据えた計算がある。エージェントが日常になるほど、一回あたりのコストの差が積み上がる。安いモデルを持つ側が、長い目で見て有利になる。今回のFlashは、その布石とも読める。速度の改善も、エージェントには効く。一つのタスクで何度もモデルを呼ぶ以上、一回あたりの応答が速いほど、作業全体の所要時間は短くなる。速さは、使い勝手とコストの両方に効く要素である。
日本への影響・示唆
第一に、AI導入のコストの壁が下がる。日本企業がAIを業務に組み込む際、最大の障壁の一つが推論コストだった。試しに使うだけなら安いが、全社で常時動かすと費用がかさむ。この壁が、本格運用への一歩を阻んできた。安く速いモデルが標準になれば、これまで採算が合わなかった用途にもAIを載せられる。社内文書の検索、問い合わせ対応、コード生成など、量をさばく業務ほど恩恵が大きい。試験導入で止まっていた計画が、本格運用へ進む余地が広がる。
第二に、検索流入の構造が変わる。Google検索のAIモードが初期設定になれば、ユーザーは検索結果のリンクをたどる前に、AIの要約で用を済ませる場面が増える。メディアやEコマースにとって、これは流入経路の変化を意味する。これまでは、検索で上位に出てクリックを集めることが集客の軸だった。だが要約で完結するなら、リンクをたどる人は減る。検索エンジン最適化(SEO)の前提が、リンクのクリックからAIへの引用へと移りつつある。コンテンツを作る側は、AIに引用されやすい構造や一次情報の厚みを意識する必要がある。要約で代替されにくい、独自の取材や視点、データの価値が相対的に高まる。誰でも書ける一般論は、AIに飲み込まれやすい。
第三に、ベンダー選びの判断軸が変わる。性能が横並びに近づくなら、企業が見るべきは単純なスコアではなく、自社の用途に合うコスト・速度・安全性である。最大のモデルを追うより、業務に載る現実的なモデルを選ぶ。グーグルが製品で示した発想は、導入する側の判断にも当てはまる。一つのモデルに縛られず、用途ごとに使い分ける構えも要る。話題のモデルに飛びつくより、自社の業務で何を解きたいかを起点に選ぶ。導入の成否は、モデルの賢さよりも、課題との適合で決まる。
今後の見通し
注目すべきポイントは三つある。
一つ目は、見送られた「Gemini 3.5 Pro」がいつ、どんな性能で登場するかである。グーグルが最上位モデルをどう位置づけるかで、性能競争の温度が見える。Flashで足場を固め、Proで頂点を狙う二段構えになるかが焦点だ。最上位モデルを急がない姿勢は、性能の頂点争いが一段落したことの表れかもしれない。
二つ目は、エージェントの本格普及である。3.5 Flashはエージェント用途を強く意識した設計だった。AIが自律的に複数の作業をこなす使い方が、実務でどこまで広がるか。コストの低下がその鍵を握る。安く動くほど、任せられる作業の幅は広がる。導入が進めば、業務の進め方そのものが変わる可能性がある。
三つ目は、規制と開発の距離である。CAISIによる公開前審査が定着すれば、最前線のモデルは政府の点検を経て世に出る流れになる。安全性の確保と開発速度の両立が、各社の課題になる。サイバー能力の扱いは、その試金石である。点検が厳しくなれば、開発の速度は落ちる。緩めれば、危険な能力が広く出回りかねない。この均衡をどう取るかが、業界全体に問われている。
これらに共通するのは、競争の重心が「最も賢いモデル」から「最も使われるモデル」へ移りつつある点だ。性能の頂点は、もはや一社が独占できない。横並びの性能のなかで、安く、速く、安全に、そして広く届ける力が問われる。グーグルのFlashは、その流れを最も明確に体現した一手である。日本の企業にとっても、この変化は「どのAIが一番賢いか」より「どのAIが自社の業務に一番なじむか」という問いへの転換を意味する。
グーグルが見送った最上位モデルの登場時期も含め、各社の次の一手から目が離せない。最大を競う時代から、製品に載る賢さを競う時代へ。AIの勝敗は、ベンチマークの外で決まり始めている。
