Project Marinerとは何だったのか
Project Marinerは、Google DeepMindが開発したAIエージェントで、Chromeブラウザをまるで人間のように操作することを目指した。 ホテルの予約、フォームへの入力、ウェブ検索、メールの整理——スクリーンショットを認識してページ要素を視覚的に理解し、クリックや入力を自動で行う仕組みだ。
発表当初は「AIが自律的にウェブを操作する未来」の象徴として注目を集めた。 しかし実際の運用では、高コストと処理の遅さという根本的な問題に直面した。 視覚的な画面理解を繰り返す処理は計算コストが高く、実用的なスピードには程遠かった。
なぜ「ブラウザエージェント」は難しいのか
プロダクトデザイナーの視点から見ると、Project Marinerの限界は「UIというインターフェースを前提にした自動化の構造的な問題」として理解できる。 ブラウザUIは人間が視覚的に解釈することを前提に設計されており、AIが同じことをするには非常に多くの処理が必要だ。
対照的に、MetaのMetal(コマンドライン型エージェント)やAnthropicのComputer Use・OpenAIのCodexは、UIを経由せず直接APIやコードを通じてシステムを操作するアーキテクチャを採用している。 UIレスのアプローチは高速で安定しており、特に「繰り返し可能な業務タスク」においては圧倒的に効率が良い。
プロダクトデザイナー視点:「エージェント設計の転換点」
Project Marinerの終了は、AIエージェント設計の方向性における「転換点」を示している。 2024〜2025年に「ブラウザを自律操作するAI」がトレンドになっていたが、実用化のハードルは想定より高かった。
今後のAIエージェントの主流は、「UIを擬似的に操作する」のではなく「APIやツール呼び出しで直接タスクを処理する」方向に向かうと見られる。 人間向けのGUIを経由せず、機械同士が直接やり取りする「エージェントネイティブなウェブ」の構築が加速するだろう。 Google Gemini 3.1 Flash-Liteが2.5倍高速化でAIエージェント開発向けの低コストモデルとして注目されているのも、この流れに沿っている。
技術はGeminiへ統合——「消えた」わけではない
Project Marinerの「終了」は、技術そのものの消滅ではない。 GoogleはMarinerのコアアルゴリズムをGemini Agentのタスク自動化レイヤーと、Google AI Modeの検索機能に統合したと説明している。
つまり、「ブラウザを使って独立したエージェントが動く」というコンセプトから、「Googleのエコシステム全体に分散・統合されたエージェント機能」へと形が変わった。 スタンドアロンの製品としてではなく、Geminiの一機能として、ウェブ操作の自律化は続いていく。 AlphaEvolveがTPU設計や量子回路の自律改善に使われているように、特定の高価値タスクに特化した「専門エージェント」への分化も進むだろう。
競合各社の動向:ブラウザエージェント市場の行方
Google Marinerの撤退は、競合他社の戦略に影響を与えうる。 OpenAIのOperator(ブラウザ操作AIエージェント)はまだ継続中だが、同様のコスト・速度の課題を抱えているとされる。 Anthropicはよりコード実行寄りのアプローチを強化しており、「UI操作」から「ツール呼び出し」へのシフトが業界全体で加速している。
一方で「UI操作型エージェント」が全く不要になるわけではない。 APIが存在しない古いシステム(レガシーシステム)や、一般消費者向けの直感的な操作補助では、視覚的なUI理解能力は依然として価値がある。 技術の方向性は変わったが、需要自体はなくならない。
今後の注目点
AIエージェントのアーキテクチャをめぐる「UI操作型」対「API呼び出し型」の議論は、2026年後半の製品開発の方向性を左右する。 Gemini Agentへの統合が実際にどのような体験をもたらすのかは、Google I/O 2026での発表が最初の見どころとなるだろう。
ウェブサイトやサービスが「人間ではなくAIエージェントによって使われる」ことを前提に再設計される時代が近づいている。 あなたのサービスは「AIエージェントが使いやすいUI」を考えたことがあるか?
ソース: