2026/3/30|更新: 2026/5/11

GPT-5.4は『答えるAI』を終わらせた。AIが人間の代わりにPCを叩く時代へ

Q: Q. 3つのバリアントはどう使い分ける？

GPT5.4 ThinkingはPlus/Team/Pro向けで推論プロセスを可視化し途中修正が可能、GPT5.4 ProはPro/Enterprise向けの最大能力モデル、GPT5.4 miniはFree/Go向けでThinkingの軽量版です。 GPT5.2 ThinkingはThinkingで自動置き換えされ、ユーザー側の操作は不要です。

AIニュース

TechCreate編集部·10分で読める

この記事でわかること

2026年3月5日リリースのGPT-5.4が汎用モデルに据えた「コンピュータ操作」

Thinking／Pro／miniの3バリアント構成とユーザー層

事実誤認33%減、GDPvalで業界専門家同等以上が83.0%という性能指標

105万トークンのコンテキストと入力$2.50/MTokという戦略的価格

GPT-5.3-Codexを統合した「コードを書く＋PCを操作する」モデル像

「答えるAI」「推論するAI」から「実行するAI」へのパラダイム転換

OpenAIが3月5日にリリースしたGPT-5.4は、見た目こそ地味なアップデートに映る。

しかし、その中身を読み解くと、AIの使われ方を根本から変えるターニングポイントであることが分かる。

最大の変化は「コンピュータ操作」だ。 GPT-5.4は、人間のようにPCを操作できる初めての汎用AIモデルとなった。

GPT-5.4の3つのバリアント — 何が変わったのか

OpenAIは今回、GPT-5.4を3つのバリアントで展開した。

バリアント	対象ユーザー	特徴
GPT-5.4 Thinking	Plus / Team / Pro	推論プロセスを可視化。思考の途中経過を表示し、方向修正が可能
GPT-5.4 Pro	Pro / Enterprise	最大能力モデル。複雑なタスクに最適化
GPT-5.4 mini	Free / Go	Thinkingの軽量版。無料ユーザーにも推論能力を提供

注目すべきは、GPT-5.2からの置き換えが段階的に行われている点だ。 Thinkingバリアントは既存のGPT-5.2 Thinkingを直接置き換えた。ユーザーは特別な操作なく、自動的に新モデルに切り替わっている。

コンピュータ操作 — AIが「手」を持った日

GPT-5.4最大の変革は、ネイティブのコンピュータ操作機能だ。

APIとCodexを通じて、GPT-5.4はコンピュータを直接操作できる。ブラウザを開き、フォームに入力し、ファイルを保存する。これまで人間がマウスとキーボードで行っていた作業を、AIが代行する。

Anthropicが先行したコンピュータ操作機能を、OpenAIは汎用モデルに統合した形だ。専用モデルではなく「汎用モデルの標準機能」として搭載したことに意味がある。

具体的にできることの例を挙げる。

ウェブブラウザでの情報収集と入力作業
複数のアプリケーションをまたいだワークフローの実行
ソフトウェアのテスト自動化
データ入力やレポート作成の自動化

これは「チャットボット」から「デジタルワーカー」への質的転換だ。

数字で見るGPT-5.4の性能

GPT-5.4のベンチマーク結果は、着実な進化を示している。

事実誤認の減少: 個々の主張レベルで33%のエラー削減（GPT-5.2比）
応答全体の正確性: エラーを含む回答が18%減少
GDPval（専門家比較テスト）: 83.0%の比較で業界専門家と同等以上（GPT-5.2は70.9%）
コンテキストウィンドウ: 最大105万トークン（API利用時）
トークン効率: GPT-5.2比で大幅に改善。同じ問題をより少ないトークンで解決

数字だけを見ると「順当な改良」に見えるかもしれない。

しかし、83%の確率で業界の専門家と同等以上のパフォーマンスを出せるモデルが、コンピュータ操作まで可能になったという事実は、企業のAI活用に直接的なインパクトを持つ。

価格戦略 — エージェントAIの「民主化」

OpenAIの価格設定も、戦略的な意図が読み取れる。

項目	GPT-5.4
API入力	$2.50 / 100万トークン
API出力	$10.00 / 100万トークン
ChatGPT Plus	月額$20で利用可能（Thinking）
ChatGPT Pro	月額$200で最大能力（Pro）
無料ユーザー	GPT-5.4 mini（Thinking機能付き）

入力トークンの単価は$2.50と、高性能モデルとしては破格に近い。 105万トークンのコンテキストを活用しても、コスト面での障壁が低い。

これは明らかに「エージェント用途」を見据えた価格設計だ。コンピュータ操作エージェントは大量のトークンを消費する。その利用コストを下げることで、導入ハードルを意図的に下げている。

GPT-5.3-Codexの遺伝子 — コーディング能力の統合

GPT-5.4のもう一つの特徴は、GPT-5.3-Codexの能力を統合したことだ。

これまでOpenAIは、汎用モデル（GPT-5.x）とコーディング特化モデル（Codex）を別系統で開発してきた。 GPT-5.4では、この2系統を初めて一つのモデルに統合した。

SWE-Bench（ソフトウェアエンジニアリングベンチマーク）での結果は公開されていないが、Codexとの統合により、以下の能力が向上している。

ツール連携: 外部APIやソフトウェアとのインテグレーション
環境理解: ソフトウェア実行環境の把握と適切な操作
マルチステップ実行: 複数の工程を順序立てて実行する能力

「コードを書くAI」と「コンピュータを操作するAI」が一つになったことで、開発者が自分の開発環境をAIに任せる未来が具体化した。

「考えるAI」から「動くAI」へ

GPT-5.4のリリースを俯瞰すると、AIの進化の方向性が見えてくる。

GPT-3.5〜4の時代は「質問に答えるAI」だった。 GPT-5.x前半は「推論するAI」だった。そしてGPT-5.4で「実行するAI」の時代が始まった。

この変化が意味するのは、AIの評価軸の変化だ。

従来は「どれだけ正確に答えられるか」が重要だった。今後は「どれだけ正確に仕事を完遂できるか」が問われる。

ベンチマークの数字よりも、実際の業務でどれだけ使えるか。その問いに対する答えが、GPT-5.4の真価を決める。

企業にとって、検討すべきタイミングはすでに来ている。

出典・参考

OpenAI「Introducing GPT-5.4」（2026年3月5日）
TechCrunch「OpenAI launches GPT-5.4 with Pro and Thinking versions」（2026年3月5日）
NxCode「GPT-5.4: 75% Computer Use, 1M Context, $2.50/MTok」（2026年3月）
Fortune「OpenAI launches GPT-5.4, its most powerful model for enterprise work」（2026年3月5日）
Tom's Hardware「Google's TurboQuant reduces AI LLM cache memory capacity requirements」（2026年3月25日）

今後の展望

GPTの影響範囲は、報道されている以上に広い。直接的な当事者だけでなく、周辺領域にも波及効果が及ぶ。

OpenAIの次のアクションがカギを握る。今回の発表に対するリアクションは、すでに水面下で動き始めている。公式発表を待つだけでなく、関連する人材の動きや投資の流れにも目を配りたい。

読者にとっての実務的なポイントは、この変化が自社や自分のキャリアにどう関わるかだ。Thinking全体のシフトを前提に、短期と中期の両方の視点で戦略を見直す時期に来ている。

投資家と事業者と個人、それぞれの視点

同じニュースでも、見る立場によって意味は大きく変わる。

投資家は株価と成長の文脈で読み、事業者は自社戦略との接続を探し、個人はキャリアと生活への影響を考える。

自分の立場を明確にし、その視点で読む習慣を持つと、情報の消化速度が上がる。

今日のニュースを、あなたはどの立場から読んでいるだろうか。

学びを自分の言葉に翻訳する

受け取った情報を、自分の言葉で要約し直す習慣は、理解の深さを大きく引き上げる。

口頭で人に説明できるレベルまで落とし込めたとき、初めてその知識は自分のものになる。

書くこと、話すこと、教えること。

いずれも学びを血肉化する強力な行為だ。

よくある質問（FAQ）

Q. GPT-5.4の最大の変化は何か？

汎用モデルとして初めて「コンピュータ操作」をネイティブ機能として搭載したことです。

APIとCodex経由でブラウザ操作・フォーム入力・ファイル保存を行え、Anthropic先行の機能を専用モデルではなく汎用モデルの標準機能として統合した点に意味があります。

Q. 3つのバリアントはどう使い分ける？

GPT-5.4 ThinkingはPlus/Team/Pro向けで推論プロセスを可視化し途中修正が可能、GPT-5.4 ProはPro/Enterprise向けの最大能力モデル、GPT-5.4 miniはFree/Go向けでThinkingの軽量版です。

GPT-5.2 ThinkingはThinkingで自動置き換えされ、ユーザー側の操作は不要です。

Q. GPT-5.2と比べてどれくらい賢くなった？

個々の主張レベルで事実誤認が33%減、応答全体でエラーを含む回答が18%減、GDPvalで業界専門家と同等以上の比較が70.9%から83.0%に向上しました。

APIのコンテキストウィンドウは最大105万トークン、同じ問題をより少ないトークンで解決するトークン効率の改善も実現しています。

Q. 料金はどうなっているのか？

API入力が$2.50／100万トークン、出力が$10.00／100万トークンで、高性能モデルとしては破格に近い設定です。

ChatGPT Plusは月額$20でThinking、Proは月額$200で最大能力、無料ユーザーもminiでThinking機能にアクセスできます。

エージェント用途を見据え、トークン大量消費の導入ハードルを意図的に下げた価格設計です。

Q. GPT-5.3-Codexの統合で何が変わった？

汎用モデルとコーディング特化モデルを初めて一つに統合しました。

外部APIやソフトウェアとのツール連携、ソフトウェア実行環境の把握と操作、複数工程を順序立てて実行するマルチステップ実行が向上し、「コードを書くAI」と「コンピュータを操作するAI」が一体化した開発体験が可能になります。

このような記事を毎週お届けします

メールアドレスだけで登録完了。いつでも解除できます。

タグ:#AI #GPT-5 #AI Agent #GPT #OpenAI #LLM

TechCreate編集部

TechCreateの編集チーム。AI・スタートアップ・エンジニアリングの最新動向を、分かりやすく深く掘り下げてお届けします。

※ AIを活用して取材・執筆を行うバーチャルジャーナリストです

この記事が参考になったら、シェアしてください。

Anthropic、ライバルMuskの巨人データセンターを丸ごと借り上げ。Claudeはコンピュート飢餓を脱するか

【完全ガイド】MCP（Model Context Protocol）とは｜AIエージェントの"USB-C規格"が97M installsを超えた理由

Claude 4.5 vs GPT-5 vs Gemini 2.5——三大LLMの実力を徹底比較

週刊テックニュースレター