OpenAIが3月5日にリリースしたGPT-5.4は、見た目こそ地味なアップデートに映る。
しかし、その中身を読み解くと、AIの使われ方を根本から変えるターニングポイントであることが分かる。
最大の変化は「コンピュータ操作」だ。 GPT-5.4は、人間のようにPCを操作できる初めての汎用AIモデルとなった。
GPT-5.4の3つのバリアント — 何が変わったのか
OpenAIは今回、GPT-5.4を3つのバリアントで展開した。
| バリアント | 対象ユーザー | 特徴 |
|---|---|---|
| GPT-5.4 Thinking | Plus / Team / Pro | 推論プロセスを可視化。思考の途中経過を表示し、方向修正が可能 |
| GPT-5.4 Pro | Pro / Enterprise | 最大能力モデル。複雑なタスクに最適化 |
| GPT-5.4 mini | Free / Go | Thinkingの軽量版。無料ユーザーにも推論能力を提供 |
注目すべきは、GPT-5.2からの置き換えが段階的に行われている点だ。 Thinkingバリアントは既存のGPT-5.2 Thinkingを直接置き換えた。 ユーザーは特別な操作なく、自動的に新モデルに切り替わっている。
コンピュータ操作 — AIが「手」を持った日
GPT-5.4最大の変革は、ネイティブのコンピュータ操作機能だ。
APIとCodexを通じて、GPT-5.4はコンピュータを直接操作できる。 ブラウザを開き、フォームに入力し、ファイルを保存する。 これまで人間がマウスとキーボードで行っていた作業を、AIが代行する。
Anthropicが先行したコンピュータ操作機能を、OpenAIは汎用モデルに統合した形だ。 専用モデルではなく「汎用モデルの標準機能」として搭載したことに意味がある。
具体的にできることの例を挙げる。
- ウェブブラウザでの情報収集と入力作業
- 複数のアプリケーションをまたいだワークフローの実行
- ソフトウェアのテスト自動化
- データ入力やレポート作成の自動化
これは「チャットボット」から「デジタルワーカー」への質的転換だ。
数字で見るGPT-5.4の性能
GPT-5.4のベンチマーク結果は、着実な進化を示している。
- 事実誤認の減少: 個々の主張レベルで33%のエラー削減(GPT-5.2比)
- 応答全体の正確性: エラーを含む回答が18%減少
- GDPval(専門家比較テスト): 83.0%の比較で業界専門家と同等以上(GPT-5.2は70.9%)
- コンテキストウィンドウ: 最大105万トークン(API利用時)
- トークン効率: GPT-5.2比で大幅に改善。同じ問題をより少ないトークンで解決
数字だけを見ると「順当な改良」に見えるかもしれない。
しかし、83%の確率で業界の専門家と同等以上のパフォーマンスを出せるモデルが、コンピュータ操作まで可能になったという事実は、企業のAI活用に直接的なインパクトを持つ。
価格戦略 — エージェントAIの「民主化」
OpenAIの価格設定も、戦略的な意図が読み取れる。
| 項目 | GPT-5.4 |
|---|---|
| API入力 | $2.50 / 100万トークン |
| API出力 | $10.00 / 100万トークン |
| ChatGPT Plus | 月額$20で利用可能(Thinking) |
| ChatGPT Pro | 月額$200で最大能力(Pro) |
| 無料ユーザー | GPT-5.4 mini(Thinking機能付き) |
入力トークンの単価は$2.50と、高性能モデルとしては破格に近い。 105万トークンのコンテキストを活用しても、コスト面での障壁が低い。
これは明らかに「エージェント用途」を見据えた価格設計だ。 コンピュータ操作エージェントは大量のトークンを消費する。 その利用コストを下げることで、導入ハードルを意図的に下げている。
GPT-5.3-Codexの遺伝子 — コーディング能力の統合
GPT-5.4のもう一つの特徴は、GPT-5.3-Codexの能力を統合したことだ。
これまでOpenAIは、汎用モデル(GPT-5.x)とコーディング特化モデル(Codex)を別系統で開発してきた。 GPT-5.4では、この2系統を初めて一つのモデルに統合した。
SWE-Bench(ソフトウェアエンジニアリングベンチマーク)での結果は公開されていないが、Codexとの統合により、以下の能力が向上している。
- ツール連携: 外部APIやソフトウェアとのインテグレーション
- 環境理解: ソフトウェア実行環境の把握と適切な操作
- マルチステップ実行: 複数の工程を順序立てて実行する能力
「コードを書くAI」と「コンピュータを操作するAI」が一つになったことで、開発者が自分の開発環境をAIに任せる未来が具体化した。
「考えるAI」から「動くAI」へ
GPT-5.4のリリースを俯瞰すると、AIの進化の方向性が見えてくる。
GPT-3.5〜4の時代は「質問に答えるAI」だった。 GPT-5.x前半は「推論するAI」だった。 そしてGPT-5.4で「実行するAI」の時代が始まった。
この変化が意味するのは、AIの評価軸の変化だ。
従来は「どれだけ正確に答えられるか」が重要だった。 今後は「どれだけ正確に仕事を完遂できるか」が問われる。
ベンチマークの数字よりも、実際の業務でどれだけ使えるか。 その問いに対する答えが、GPT-5.4の真価を決める。
企業にとって、検討すべきタイミングはすでに来ている。
出典・参考
- OpenAI「Introducing GPT-5.4」(2026年3月5日)
- TechCrunch「OpenAI launches GPT-5.4 with Pro and Thinking versions」(2026年3月5日)
- NxCode「GPT-5.4: 75% Computer Use, 1M Context, $2.50/MTok」(2026年3月)
- Fortune「OpenAI launches GPT-5.4, its most powerful model for enterprise work」(2026年3月5日)
- Tom's Hardware「Google's TurboQuant reduces AI LLM cache memory capacity requirements」(2026年3月25日)
