Motubrain「1つの脳で全ロボット」の技術的革新
従来のロボット制御AIは「タスク特化型」が主流だった。 工場の溶接ロボット、物流倉庫のピッキングロボット、医療用手術支援ロボット——それぞれに最適化されたモデルが存在し、異なるタスクには異なるシステムが必要だった。
Motubrain(MotuBrain)はこの前提を覆す。 ビデオ・言語・アクションの三つのモダリティを同時に処理する「三ストリームMixture-of-Transformers」アーキテクチャにより、ひとつのモデルが複数のロボット種・複数のタスクを横断して処理できる。
UniDiffuserというアーキテクチャを採用し、ビデオ(視覚的世界認識)とアクション(物理的な動作生成)という二つの連続モダリティを統合的に扱う。 ロボットは「見て・予測して・動く」という流れをひとつのモデル内で完結できるのが特徴だ。
ベンチマーク結果も注目に値する。 WorldArenaで63.77 EWMスコアを記録し、RoboTwin 2.0では50の所定タスクで平均96.0という高スコアを達成した。 これらは「体現型ワールドモデル」の最も厳格なベンチマークとして知られている。
地政学アナリストの視点——「物理AI」覇権という新戦線
地政学的観点から見ると、ShengShuの動きは単なるAI技術の競争ではない。
2026年に入り、米中のAI競争は「ソフトウェア・モデル」から「物理AI」へと戦線を拡大しつつある。 物理AIとはロボット・製造ライン・物流・建設などの実物理世界に適用されるAIを指し、NVIDIAがCosmos 3やGR00T N1.7を発表したように、米国側も「物理AI」を次の競争軸と位置付けている。
ShengShuのバックには、アリババクラウド、百度ベンチャーズ、中国インターネット投資基金(CIIF)という国家資本と民間資本の混合体制が存在する。 CIIFは中国国家発展改革委員会が管理するファンドであり、ShengShuへの投資は「国家戦略」の文脈に位置付けられる。
米中がフロンティアAI安全規範を合意したソフトウェアの世界と異なり、ロボットAIは「製造現場への直接適用」という経済競争の核心に触れる。 工場・物流・農業・医療での物理AIの覇権が、製造業競争力の次の決定要因になるという見立てが現実性を帯びてきた。
Motubrain vs NVIDIAの「Cosmos 3」——物理AI基盤モデル戦争
物理AI領域では、ShengShuとNVIDIAが真正面からぶつかりつつある。
NVIDIAのCosmos 3は、合成世界生成・視覚推論・アクションシミュレーションを統合した「ワールド基盤モデル」で、開発者がロボットを複雑環境で動かすための基盤として設計されている。 GR00T N1.7は早期アクセスの汎用ロボット基盤モデルで、手先の器用さや自律タスク実行の汎用能力を提供する。
ShengShuのMotubrainとNVIDIAのCosmos/GR00Tの違いは何か。
NVIDIAは「エコシステム提供者」として振る舞っており、多様なロボットメーカーがNVIDIAのプラットフォーム上で開発する構図を目指している。 一方のShengShuは「ひとつのモデルで全部解決する」という自前統合を志向している。
これはiOSとAndroid、あるいはAWSと自社インフラという構図に近い。 どちらが「物理AI」の標準プラットフォームになるかは、ロボット産業の将来図を大きく左右する。
商業展開の現状と「研究から現場へ」の臨界点
ShengShuはMotubrainが既に「商業稼働中」であることを強調している点も注目に値する。
産業・商業・ホーム環境のロボットに対し、クロスエンボディメント(複数のロボット種横断)・マルチスキル能力を実際のハードウェアで展開しているとされる。 これは「研究プロトタイプ」ではなく「商業製品」として主張している点で、従来の中国AI企業の発表と一線を画す。
一方で独立した第三者検証は限られており、ベンチマーク数値の独立性については継続的な検証が必要だ。 中国AI企業のベンチマーク主張は過去に誇張事例もあり、実際の工場展開での性能が問われることになる。
日本製造業への波及——「ロボット大国」の優位は続くか
日本は世界最大のロボット輸出国のひとつであり、ファナック・安川電機・川崎重工がグローバルロボット市場を牽引してきた。 だが、これらの企業が強みとするのは「機械としてのロボット」であり、「AIとしてのロボット」の制御技術は別の競争軸だ。
ShengShuのようなワールドアクションモデルが「汎用ロボット制御の標準」になれば、日本のロボットメーカーは「ハードウェアを作るが、AIはShengShuやNVIDIAに依存する」という構造に陥るリスクがある。
AIエージェントの拡大が示すように、ソフトウェアの標準を押さえたプレーヤーがハードウェアの価値を規定する時代が来ようとしている。 「ロボット大国・日本」という優位が「物理AI大国」の時代にも続くかどうか、ShengShuとNVIDIAの競争はその問いに対する一つの試金石になっている。
地政学的な半導体規制との連動
Motubrainが搭載する高性能AIチップは、その供給源が地政学的な問題と直接連動する。
米国がNVIDIA H200の対中輸出を承認した後も、中国企業が国産チップを選ぶ流れが続いていることは、ShengShuにとっても重要な文脈だ。 Motubrain開発に用いるGPUが国産(Huawei Ascend等)か輸入品かによって、米国の輸出規制が物理AI開発に与える影響が変わってくる。
地政学アナリスト視点では、「物理AI」の標準が誰によって確立されるかは、製造業の次の10年の競争力を左右する構造的な問いだ。 米中どちらが物理AIのデファクトスタンダードを制するかは、半導体・ロボット・製造業を横断した大局的な問いとして受け止める必要がある。
「物理AI」時代のAI覇権はどこへ
ShengShuのMotubrainが示すのは、AIの競争が「画面の中」から「物理世界」へと拡大しているという現実だ。
大規模言語モデルの性能競争は、モデルのインテリジェンスを「知的作業」に適用するフェーズだった。 次のフェーズは、そのインテリジェンスを「手足を持ったロボット」に移植する競争だ。
その競争において、米中それぞれが異なるアーキテクチャ・異なるビジネスモデル・異なる地政学的バックグラウンドで挑んでいる。 どちらが「物理AI」の標準プラットフォームを制するか——製造業・物流・医療の未来が、この技術競争の結果に左右される。
あなたの産業にとって「物理AI」の普及はいつ、どんな形でやってくるだろうか。
ソース:
- ShengShu launches unified world action model to power next-generation robotic intelligence — Robotics and Automation News (2026-05-15)
- ShengShu Technology Unveils World Action Model "Motubrain" — PR Newswire (2026-04-29)
- NVIDIA Releases New Physical AI Models as Global Partners Unveil Next-Generation Robots — NVIDIA Newsroom (2026-05)
- Humanoid Robotics In 2026: The Race From Pilot To Platform — KraneShares (2026)