Foundryカタログ1万1,000モデルとは——エンジニアが知るべき構造
Microsoft Foundryには現在、以下のモデル群が収録されている。
クローズドフロンティア系: GPT-5.5(OpenAI)、Claude Opus 4.8・Sonnet 4.5・Haiku 4.5(Anthropic)、Geminiシリーズ(Google)。 オープンソース系: LlamaシリーズをはじめとするFireworks AI経由のモデル群。 Microsoft独自: MAI(Microsoft AI)ファミリー。 その他: 視覚・多言語・時系列特化の専用小型モデル群。
全てに共通するのは「1つのAzureエンドポイント、1つの請求関係」だ。 従来は各プロバイダーのAPIキーを別々に管理し、コスト精算も分散していた。 Foundryはこれを一元化することで、「どのモデルを選ぶか」という意思決定にだけ集中できる開発環境を作っている。
Claude Opus 4.8のFoundry実装——何が使えて何に注目すべきか
Claude Opus 4.8はFoundryで5月29日から提供されている。 コンテキストウィンドウは20万トークン、価格は入力100万トークンあたり5ドル・出力100万トークンあたり25ドルだ。
エンジニアとして実際に注目すべきは高速モードで、通常速度の2.5倍・コスト3分の1で動作する。 Claude Codeとの組み合わせで、数十万行規模のマイグレーションを自律実行できるというユースケースは、CI/CDパイプラインの在り方を変えうる。
さらに6月9日にはClaude Fable 5とMythos 5がFoundry・Amazon Bedrock・Google Vertex AIで同時提供開始となり、Anthropicの最強モデルが全主要クラウドで横断利用可能になった。 「どのクラウドを使うか」に関わらず、最強モデルを選べる時代が来た。
GPT-5.5 InstantのFree展開——無料ユーザーにも「記憶」が届く
6月9日、OpenAIはGPT-5.5 InstantのパーソナライゼーションをChatGPT Go(無料)・Freeプランに展開した。
この機能の核心は、ChatGPTが過去の会話・アップロードしたファイル・Gmailを参照しながら回答を生成できる点だ。 「私のProject XのGitHubリポジトリのREADMEを元に、PRの説明文を書いて」といった「文脈知能」が無料ユーザーでも使えるようになった。 記憶ソースの透明性機能(どの情報から回答したかを表示)も全モデルに展開されており、誤った記憶の削除・修正が可能だ。
GPT-5.5 InstantはGPT-5.3 Instant比でハルシネーションを52.5%削減したと報告されており、医療・法律・金融などハイリスク分野での実用性が上がっている。
GPT-5.6の「カナリア漏洩」——開発者が準備すべきことは何か
OpenAIのCodex内部ロールアウトログにGPT-5.6の名前が1件だけ現れ、すぐに消えた。 いわゆる「カナリアリリース」の痕跡だ。
リーク情報とPolymarket予測市場の動向を総合すると、GPT-5.6の特徴は以下とみられる。 コンテキストウィンドウは150万トークン(GPT-5.5の約4倍)。 推論能力はFrontierMath Tier 4相当への到達。 リリース時期は6月下旬(Polymarketで6月末の確率が80〜89%と高止まり)。
エンジニアとして準備すべきなのは「コンテキスト設計の見直し」だ。 150万トークンが使えるなら、RAGの設計思想が変わる可能性がある。 大規模コードベースをそのまま投入できる世界では、「何を渡すか」より「何を省くか」の判断が重要になる。
AIモデルの価格戦争と性能向上が同時進行する今、エンジニアの武器は「適切なモデルを適切なタスクに選ぶ能力」だ。 Foundryの1万1,000モデルカタログはその選択肢を整理するインフラであり、いかに選ぶかを問う設計上の試練でもある。
OpenAI、Oracle Cloud経由でアクセスを拡大——Stargateとの接合
6月11日、OpenAIはOracle Cloud Committedを通じて、GPT-5.5をはじめとするモデル群とCodexへのアクセスを拡大すると発表した。
OracleはStargateプロジェクトの主要インフラパートナーだ。 Stargate(2026年1月発表、総投資5,000億ドル)は、物理データセンター建設においてOracleが中核的役割を担う。 OpenAIモデルとOracleクラウドの統合は、Stargateインフラの「商用展開ルート」の一つだ。
Microsoft Majorana 2が量子コンピュータロードマップを加速させる一方、AIのクラウドインフラは現在のシリコン基盤で「選択の集約」が先行している。
「1エンドポイント」の先——Foundryが変えるアーキテクチャの常識
Foundryの一元化が本当に意味を持つのは、「モデルの切り替え」ではなく「モデルの組み合わせ」においてだ。 タスクによってClaude Opus 4.8のコーディング能力とGPT-5.5のパーソナライゼーション機能を切り替え、Geminiの長文脈処理を特定のドキュメント解析に使う——という動的モデル選択が、1つの請求IDで完結する。
マルチエージェントシステムを設計するとき、各エージェントが最適なモデルを選択する「モデルルーター」が重要になってきた。 Foundryはその実装コストを大幅に下げている。
あなたが次のプロダクトを設計するとき、「どのAIクラウドを使うか」より先に「どのモデルをどのタスクに割り当てるか」を問うことになる。 その問いへの答えが、2026年下半期のエンジニアリング競争力を分けることになる。
ソース: