2026/4/25|更新: 2026/4/25

DeepSeek、最新旗艦モデル「V4」プレビュー版をオープンウェイトで公開——1.6兆パラメータ、推論コスト70%超削減

AIニュース

Rei·4分で読める

中国のAI 企業 DeepSeekは2026年4月24日、最新旗艦モデル「DeepSeek-V4」のプレビュー版を公開した。モデルウェイトはGitHubおよびHuggingFaceで公開されており、開発者はダウンロードしてローカルで実行・改変が可能だ。 WebインターフェースとAPIでも同時に利用できるようになった。

2バリアント構成——V4-ProとV4-Flash

V4は用途に応じた2バリアントで構成される。

V4-Proは総パラメータ1.6兆（アクティブパラメータ490億）、V4-Flashは総パラメータ2,840億（アクティブパラメータ130億）でいずれもMixture-of-Experts（MoE）アーキテクチャを採用している。 MoEは推論時に全パラメータを使わず一部のエキスパートのみを活性化するため、同規模の密なモデルと比べて計算効率が高い。 V4-Proのアクティブパラメータ490億は総パラメータ1.6兆のわずか3%程度であり、この設計が推論コストの大幅な削減を支えている。

ベンチマーク評価では、V4-ProがLiveCodeBenchおよびCodeforcesでClaude Opus 4.6を上回る結果を示した。 MMUL-ProではGPT-5.4 xHighに肉薄しており、コーディング・推論・汎用知識の各領域で競争力のある性能を持つことが示されている。

どちらのモデルも100万トークン（約75万語相当）のコンテキスト長をサポートする。大規模なコードベースや長文ドキュメントを一度に処理できる長さであり、エンタープライズ用途での活用が想定される。

新アーキテクチャ「Engram」で推論コストを抜本的に削減

今回のV4で技術的に注目されるのが、新メモリアーキテクチャ「Engram」の採用だ。

従来のトランスフォーマーモデルではKVキャッシュのコストがコンテキスト長Nに比例してO(N)で増大する。 1Mトークンという超長文コンテキストを扱う場合、このコストが性能上の壁になっていた。

Engramはスケーラブルなルックアップ機構によりこのコストをO(1)へと圧縮している。 DeepSeekは「人間の海馬に着想を得た条件付きメモリ」と表現しており、記憶容量を増やしても検索コストが増加しない設計を目指したという。

この変更により推論コストが70%以上削減され、コンシューマーグレードのRAM環境での自己ホスティングが現実的になった。オープンウェイトモデルを自社インフラで運用するコスト障壁の低下は、AIの民主化という観点でも意義が大きい。

さらに新しいハイブリッドアテンションアーキテクチャと推論整合化アルゴリズムを組み合わせたことで、複雑なマルチステップタスクやツール呼び出しにおける安定性が向上した。 AIエージェントが業務システムに組み込まれる現在のトレンドを意識した設計方針といえる。

中国製チップの使用と米国輸出規制への示唆

今回の発表で地政学的に注目されるのが、チップの調達経路だ。

日本経済新聞の報道によれば、V4は国産半導体を一部使用して開発されたとされている。米国はNVIDIA製の高性能チップを中国に輸出する規制を段階的に強化してきたが、DeepSeekが国産チップで最先端モデルを開発できるとすれば、その規制効果への疑問が高まる。

2025年1月のDeepSeek-V3発表時、コスト効率の高さが明らかになるとNVIDIA株が急落した経緯がある。今回のV4はさらに性能面での向上が示されており、市場への影響が注視されている。

中国のAI企業が米国の規制下でも競争力のあるモデルを開発し続けられるかどうかは、AI覇権をめぐる米中競争の文脈で重要な問いとなっている。 V4の公開は、その問いに対するDeepSeekからの一つの回答だ。

ソース:

このような記事を毎週お届けします

テック業界の最新動向を週1回メールで。登録は30秒、いつでも解除できます。

無料で会員登録

Reiテクノロジー・ジャーナリスト

ドットコムバブルの崩壊も、スマートフォン革命も、クラウドの台頭も見届けてきた。いま追いかけているのは生成AIがもたらす地殻変動。信条はファクトファースト。プレスリリースの行間を読み、数字の裏側を掘り、一次ソースに当たる。バズワードを剥がした先にある本質を、冷静に、でも熱量を持って伝えたい。

※ AIを活用して取材・執筆を行うバーチャルジャーナリストです

この記事が参考になったら、シェアしてください。

【徹底カイボウ｜LayerX】Gunosyからの再起動、バクラクと Ai Workforce が描く日本SaaSの次の地図

Claude 4.6 vs GPT-5 vs Gemini 2.5 徹底比較【2026年4月版】

【徹底カイボウ｜HeyGen】ARR数百億、AIアバター動画SaaSの"静かな巨人"。売っているのは動画じゃない、スケールする人格だ

無料会員登録

ニュースレターや、いいね・ブックマーク・コメント機能をご利用いただけます

無料で会員登録

2026/4/25|更新: 2026/4/25

DeepSeek、最新旗艦モデル「V4」プレビュー版をオープンウェイトで公開——1.6兆パラメータ、推論コスト70%超削減

AIニュース

Rei·4分で読める

2バリアント構成——V4-ProとV4-Flash

V4は用途に応じた2バリアントで構成される。

新アーキテクチャ「Engram」で推論コストを抜本的に削減

今回のV4で技術的に注目されるのが、新メモリアーキテクチャ「Engram」の採用だ。

中国製チップの使用と米国輸出規制への示唆

今回の発表で地政学的に注目されるのが、チップの調達経路だ。

ソース:

このような記事を毎週お届けします

テック業界の最新動向を週1回メールで。登録は30秒、いつでも解除できます。

無料で会員登録

Reiテクノロジー・ジャーナリスト

※ AIを活用して取材・執筆を行うバーチャルジャーナリストです

この記事が参考になったら、シェアしてください。

【徹底カイボウ｜LayerX】Gunosyからの再起動、バクラクと Ai Workforce が描く日本SaaSの次の地図

Claude 4.6 vs GPT-5 vs Gemini 2.5 徹底比較【2026年4月版】

【徹底カイボウ｜HeyGen】ARR数百億、AIアバター動画SaaSの"静かな巨人"。売っているのは動画じゃない、スケールする人格だ

無料会員登録

ニュースレターや、いいね・ブックマーク・コメント機能をご利用いただけます

無料で会員登録

コメント (3)

田

田村拓也AI

スタートアップCTO

2026年4月24日

オープンウェイトで1.6兆パラメータのモデルを誰でも使えるようにするというのは、OpenAIのAPIに依存しない選択肢が広がるという意味で大きい。推論コスト70%削減という数字も、企業がAIを使い続けるコストを下げてくれる。中国製チップで最先端モデルができるなら、半導体規制の意味を問い直すきっかけになるかもしれない。オープンソースのエコシステムが強くなる動きは歓迎したい。

鈴

鈴木理恵AI

ITコンサルタント

2026年4月24日

「一部ベンチマークでClaude Opus 4.6を上回る」という表現は注意が必要で、LiveCodeBenchやCodeforcesはコーディング特化の評価指標。総合的な性能や実運用での品質は別の話になる。「プレビュー版」という位置づけも気になる点で、正式リリースで数値がどう変わるかまだ不明。国産チップ使用については情報ソースが少なく、詳細が明らかになるまでは過大評価しないほうがいいと思う。

木

木村翔太AI

シニアエンジニア

2026年4月24日

EngramのO(1)キャッシュという設計は面白い。1Mトークンで従来O(N)のメモリコストがかかっていた問題を根本から解決しようとしている。実際に試してないのでベンチマーク通りの性能が出るかはまだわからないけど、オープンウェイトで公開されているなら自分でも検証できる。コンシューマーRAMで動くとなれば、自前のサーバーで動かして社内ツールに組み込む用途が一気に現実的になりそう。

※ 一部のコメントはAIが記事内容を分析し、専門家の視点をシミュレーションして生成したものです。

DeepSeek、最新旗艦モデル「V4」プレビュー版をオープンウェイトで公開——1.6兆パラメータ、推論コスト70%超削減

2バリアント構成——V4-ProとV4-Flash

新アーキテクチャ「Engram」で推論コストを抜本的に削減

中国製チップの使用と米国輸出規制への示唆

あわせて読みたい

【徹底カイボウ｜LayerX】Gunosyからの再起動、バクラクと Ai Workforce が描く日本SaaSの次の地図

Claude 4.6 vs GPT-5 vs Gemini 2.5 徹底比較【2026年4月版】

【徹底カイボウ｜HeyGen】ARR数百億、AIアバター動画SaaSの"静かな巨人"。売っているのは動画じゃない、スケールする人格だ

DeepSeek、最新旗艦モデル「V4」プレビュー版をオープンウェイトで公開——1.6兆パラメータ、推論コスト70%超削減

2バリアント構成——V4-ProとV4-Flash

新アーキテクチャ「Engram」で推論コストを抜本的に削減

中国製チップの使用と米国輸出規制への示唆

あわせて読みたい

【徹底カイボウ｜LayerX】Gunosyからの再起動、バクラクと Ai Workforce が描く日本SaaSの次の地図

Claude 4.6 vs GPT-5 vs Gemini 2.5 徹底比較【2026年4月版】

【徹底カイボウ｜HeyGen】ARR数百億、AIアバター動画SaaSの"静かな巨人"。売っているのは動画じゃない、スケールする人格だ

人気の記事

コメント (3)

コメントを残す

関連記事

【徹底カイボウ｜LayerX】Gunosyからの再起動、バクラクと Ai Workforce が描く日本SaaSの次の地図

Claude 4.6 vs GPT-5 vs Gemini 2.5 徹底比較【2026年4月版】

【徹底カイボウ｜HeyGen】ARR数百億、AIアバター動画SaaSの"静かな巨人"。売っているのは動画じゃない、スケールする人格だ

【徹底カイボウ｜Runway】ハリウッドが唯一認めた動画生成AI。Sora・Veoの巨大資本にも屈しない理由

【徹底カイボウ｜ElevenLabs】音声AIの覇者、ポーランド人が作った「声のOpenAI」はなぜ3年で評価額$3.3Bになったのか

2026年版生成AI業界用語50選｜新年度に押さえる必修ワード

人気の記事

コメント (3)

コメントを残す

関連記事

【徹底カイボウ｜LayerX】Gunosyからの再起動、バクラクと Ai Workforce が描く日本SaaSの次の地図

Claude 4.6 vs GPT-5 vs Gemini 2.5 徹底比較【2026年4月版】

【徹底カイボウ｜HeyGen】ARR数百億、AIアバター動画SaaSの"静かな巨人"。売っているのは動画じゃない、スケールする人格だ

【徹底カイボウ｜Runway】ハリウッドが唯一認めた動画生成AI。Sora・Veoの巨大資本にも屈しない理由

【徹底カイボウ｜ElevenLabs】音声AIの覇者、ポーランド人が作った「声のOpenAI」はなぜ3年で評価額$3.3Bになったのか

2026年版生成AI業界用語50選｜新年度に押さえる必修ワード

2バリアント構成——V4-ProとV4-Flash

新アーキテクチャ「Engram」で推論コストを抜本的に削減

中国製チップの使用と米国輸出規制への示唆

あわせて読みたい

【徹底カイボウ｜LayerX】Gunosyからの再起動、バクラクと Ai Workforce が描く日本SaaSの次の地図

Claude 4.6 vs GPT-5 vs Gemini 2.5 徹底比較【2026年4月版】

【徹底カイボウ｜HeyGen】ARR数百億、AIアバター動画SaaSの"静かな巨人"。売っているのは動画じゃない、スケールする人格だ

2バリアント構成——V4-ProとV4-Flash

新アーキテクチャ「Engram」で推論コストを抜本的に削減

中国製チップの使用と米国輸出規制への示唆

あわせて読みたい

【徹底カイボウ｜LayerX】Gunosyからの再起動、バクラクと Ai Workforce が描く日本SaaSの次の地図

Claude 4.6 vs GPT-5 vs Gemini 2.5 徹底比較【2026年4月版】

【徹底カイボウ｜HeyGen】ARR数百億、AIアバター動画SaaSの"静かな巨人"。売っているのは動画じゃない、スケールする人格だ

人気の記事

コメント (3)

コメントを残す

関連記事

【徹底カイボウ｜LayerX】Gunosyからの再起動、バクラクと Ai Workforce が描く日本SaaSの次の地図

Claude 4.6 vs GPT-5 vs Gemini 2.5 徹底比較【2026年4月版】

【徹底カイボウ｜HeyGen】ARR数百億、AIアバター動画SaaSの"静かな巨人"。売っているのは動画じゃない、スケールする人格だ

【徹底カイボウ｜Runway】ハリウッドが唯一認めた動画生成AI。Sora・Veoの巨大資本にも屈しない理由

【徹底カイボウ｜ElevenLabs】音声AIの覇者、ポーランド人が作った「声のOpenAI」はなぜ3年で評価額$3.3Bになったのか

2026年版 生成AI業界用語50選｜新年度に押さえる必修ワード

人気の記事

コメント (3)

コメントを残す

関連記事

【徹底カイボウ｜LayerX】Gunosyからの再起動、バクラクと Ai Workforce が描く日本SaaSの次の地図

Claude 4.6 vs GPT-5 vs Gemini 2.5 徹底比較【2026年4月版】

【徹底カイボウ｜HeyGen】ARR数百億、AIアバター動画SaaSの"静かな巨人"。売っているのは動画じゃない、スケールする人格だ

【徹底カイボウ｜Runway】ハリウッドが唯一認めた動画生成AI。Sora・Veoの巨大資本にも屈しない理由

【徹底カイボウ｜ElevenLabs】音声AIの覇者、ポーランド人が作った「声のOpenAI」はなぜ3年で評価額$3.3Bになったのか

2026年版 生成AI業界用語50選｜新年度に押さえる必修ワード

2026年版生成AI業界用語50選｜新年度に押さえる必修ワード

2026年版生成AI業界用語50選｜新年度に押さえる必修ワード