DeepSeekとは何か――中国発オープンソースAIの全体像
DeepSeekは、2023年に中国・杭州で設立されたAIスタートアップ High-Flyer(幻方量化)の子会社が開発する大規模言語モデル(LLM)群である。ヘッジファンド出身の創業者 Liang Wenfeng が率い、設立からわずか2年で世界的な注目を集めた。
| 項目 | 内容 |
|---|---|
| 設立 | 2023年、中国・杭州 |
| 親会社 | High-Flyer(幻方量化) |
| 代表モデル | DeepSeek-V3系(汎用)、DeepSeek-R1系(推論特化) |
| アーキテクチャ | Mixture-of-Experts(MoE) |
| パラメータ数 | 671B(うち37Bがアクティブ) |
| コンテキスト長 | 最大128Kトークン |
| ライセンス | MIT License(オープンソース) |
| 月間アクティブユーザー | 約3,370万人(2025年1月時点) |
| 対応言語 | 英語・中国語・日本語ほか多言語 |
2025年1月のローンチ後わずか数週間で3,000万日次アクティブユーザーを記録し、157か国のアプリストアでチャートトップに立った。ChatGPTを超えるダウンロード数を叩き出したことは、中国AI勢の技術力を世界に示す決定的な出来事となった。
DeepSeekの主要モデル比較――V3系 vs R1系
DeepSeekの製品群は大きく「汎用モデル(V3系)」と「推論特化モデル(R1系)」に分かれる。それぞれの位置づけを整理する。
| モデル | リリース時期 | 特徴 | 主な用途 |
|---|---|---|---|
| DeepSeek-V3 | 2024年12月 | MoE 671B、汎用高性能 | コーディング、翻訳、対話全般 |
| DeepSeek-V3-0324 | 2025年3月 | R1のRL手法を導入し推論力向上 | 数学・コード・ツール連携 |
| DeepSeek-V3.1 | 2025年8月 | V3+R1統合ハイブリッド、128Kコンテキスト | エージェント構築、検索連携 |
| DeepSeek-V3.2 | 2025年9月〜 | GPT-5級ベンチマーク、IMO金メダル相当 | 高難度推論、研究 |
| DeepSeek-R1 | 2025年1月 | Chain-of-Thought推論を可視化 | 数学・科学・論理問題 |
| DeepSeek-R1-0528 | 2025年5月 | R1改良版、推論精度向上 | 複雑なステップ分解 |
V3系は「速く・広く・安く」使いたい場面に適し、R1系は「深く・正確に」考えさせたい場面に強い。2025年8月のV3.1では、1つのモデル内でthinking(推論モード)とnon-thinking(直接回答モード)を切り替えられるハイブリッド設計が導入された。用途に応じて推論の深さを制御できるため、実務での使い勝手が大幅に向上している。
DeepSeek-R1の推論チェーン――「考える過程」が見えるAI
R1系モデル最大の特徴は、Chain-of-Thought(CoT)推論プロセスが <think> タグ内に明示的に表示される点である。従来のLLMがブラックボックス的に回答を出力するのに対し、R1は「どのように結論に至ったか」をユーザーが確認できる。
- 思考プロセスの可視化: 回答前に数百〜数千トークンの推論ステップを生成
- 自己検証メカニズム: 途中で誤りに気づくと自発的にアプローチを修正
- 強化学習ベース: GRPO(Group Relative Policy Optimization)アルゴリズムにより、教師データなしで推論能力を獲得
- 蒸留モデルの存在: 7Bパラメータ版など軽量モデルにR1の推論力を移植したバリエーションあり
訓練手法も特筆に値する。R1-Zeroはベースモデルに対して直接強化学習を適用し、教師あり学習(SFT)を経ずにCoT能力を獲得した。つまり「考え方」を人間が教えるのではなく、モデル自身が試行錯誤の中で推論パターンを発見するという、従来のアプローチとは根本的に異なる設計思想を持つ。
使い方 1: Web版(chat.deepseek.com)――最速で試すならここ
もっとも手軽にDeepSeekを体験する方法が、公式Webチャットの利用である。
| ステップ | 操作内容 |
|---|---|
| 1. アクセス | chat.deepseek.com にブラウザからアクセス |
| 2. アカウント作成 | メールアドレス or Googleアカウントで登録 |
| 3. 認証 | メールに届く認証コードを入力 |
| 4. チャット開始 | テキスト入力欄に質問を入力して送信 |
| 5. モデル切替 | 画面上部でDeepThink(R1相当)/ 通常モード を切り替え |
Web版の最大の利点は無料であることだ。個人利用や調査目的であれば、追加料金なしでV3系・R1系双方の性能を体験できる。日本語入力にも対応しており、自然な日本語で質問すれば日本語で回答が返ってくる。
ただし注意点もある。Web版を利用する場合、入力データはDeepSeekのサーバー(中国国内に所在)に送信される。機密情報や個人データの入力は避けるのが賢明だ。この点については後述の安全性セクションで詳しく取り上げる。
使い方 2: API版――開発者・ビジネス向けの本命
アプリケーション開発やビジネス利用において最も柔軟なのがAPI経由でのアクセスである。
| 項目 | 詳細 |
|---|---|
| エンドポイント | |
| OpenAI互換 | OpenAI SDKをそのまま利用可能(base_urlの変更のみ) |
| 利用可能モデル | deepseek-chat(V3系)、deepseek-reasoner(R1系) |
| コンテキスト長 | 最大128K(入力)/ 最大64K(出力、reasoner) |
| 対応機能 | Function Calling、JSON出力、Fill-in-the-Middle |
| 認証 | APIキー(platform.deepseek.com で発行) |
OpenAI互換APIを採用しているため、既存のOpenAI SDKやLangChain、LlamaIndexといったフレームワークからの移行が容易である。Pythonの場合、OpenAIクライアントのbase_urlを変更し、APIキーを差し替えるだけで動作する。
API版の料金体系(100万トークンあたり、2026年3月時点)は以下の通りである。
| モデル | 入力(キャッシュヒット) | 入力(キャッシュミス) | 出力 |
|---|---|---|---|
| deepseek-chat | $0.028 | $0.28 | $0.42 |
| deepseek-reasoner | $0.14 | $0.55 | $2.19 |
比較対象としてGPT-4oは入力$2.50 / 出力$10.00であるため、deepseek-chatは入力コストで約1/9、出力コストで約1/24という圧倒的な価格差がある。月間10億トークンを処理する企業の場合、DeepSeekなら約420ドル、GPT-4oなら約13,000ドルと、およそ30倍のコスト差が生じる。
使い方 3: ローカル版(Ollama経由)――データを外に出さない選択肢
プライバシーを最重視する場合、あるいはオフライン環境で利用したい場合に有力なのが、Ollamaを使ったローカル実行である。
| ステップ | 操作内容 |
|---|---|
| 1. Ollamaインストール | ollama.com から自分のOSに合ったインストーラをダウンロード |
| 2. モデル取得 | ターミナルで ollama run deepseek-r1 を実行(自動DL開始) |
| 3. モデルサイズ選択 | 1.5B / 7B / 8B / 14B / 32B / 70B / 671B から選択 |
| 4. 対話開始 | ダウンロード完了後、そのままターミナルで対話可能 |
| 5. WebUI連携 | Open WebUIなどを導入すればブラウザ上で操作可能 |
ローカル実行のメリットは明確だ。データが一切外部に送信されないため、社内の機密文書の分析や個人情報を含むタスクにも安心して利用できる。API料金も発生しない。
一方で、十分なハードウェアリソースが必要になる。推奨スペックの目安は以下の通りである。
| モデルサイズ | 必要VRAM(目安) | 推奨GPU |
|---|---|---|
| 1.5B | 2GB | CPU実行も可 |
| 7B | 6〜8GB | RTX 3060以上 |
| 14B | 12〜16GB | RTX 4070以上 |
| 32B | 24〜32GB | RTX 4090 / A6000 |
| 70B | 48GB+ | A100 / H100 |
| 671B | 320GB+ | マルチGPU必須 |
個人で手軽に試すなら7Bの蒸留モデルがバランスが良い。Lightblue社が公開した日本語特化版(deepseek-r1:7b-qwen-distill)は、日本語での思考が得意で、コンシューマーGPUでも動作する。ローカルLLMやOllamaの詳しい導入方法については、関連記事も参照してほしい。
料金体系の全体像――「GPT-4oの1/10以下」は本当か
DeepSeekの価格競争力を、主要モデルと横並びで比較する。
| モデル | 入力(/1Mトークン) | 出力(/1Mトークン) | 入力コスト比(vs GPT-4o) |
|---|---|---|---|
| DeepSeek V3系 | $0.28 | $0.42 | 約1/9 |
| DeepSeek R1系 | $0.55 | $2.19 | 約1/4.5 |
| GPT-4o | $2.50 | $10.00 | 基準 |
| Claude 3.5 Sonnet | $3.00 | $15.00 | 1.2倍 |
| Gemini 1.5 Pro | $1.25 | $5.00 | 0.5倍 |
V3系(deepseek-chat)であれば、入力・出力の加重平均で見てGPT-4oの約1/10〜1/20のコストで運用できる。R1系(deepseek-reasoner)は推論トークンのオーバーヘッドがあるため割高だが、それでもGPT-4oの半額以下である。
さらに注目すべきはキャッシュヒット時の価格だ。同一プロンプトの繰り返し利用が多いワークフローでは、入力コストが$0.028まで下がる。バッチ処理やテンプレート的な利用シーンではコスト削減効果が極めて大きい。
ただし、DeepSeekは2025年にプロモーション価格終了後、API料金を最大300%引き上げた実績がある。現行価格が恒久的に維持される保証はない点は留意すべきだ。
「DeepSeekショック」の背景――なぜ世界を揺るがしたのか
2025年1月27日、DeepSeek-R1の公開を受けて米国株式市場は大きく動揺した。この日だけで米テック企業の時価総額は約1兆ドル消失したとされる。
- NVIDIAは約17%下落し、1日で約5,890億ドルの時価総額を喪失(史上最大の1日あたり下落額)
- Broadcomは17.4%下落
- NASDAQコンポジットは約3.1%下落(2024年12月以来最大の1日下落率)
市場が驚いた最大の理由は、訓練コストの常識が覆されたことにある。DeepSeekはV3の訓練に約600万ドルしかかけていないと公表した。OpenAIがGPT-4に1億ドル以上を投じたのとは桁が違う。MoEアーキテクチャによるパラメータの効率的な利用、KVキャッシュ削減技術(93%超の圧縮)、そして中国国内の人件費の優位性が、この低コストを実現した。
Goldman Sachsは「企業はより手頃なインフラソリューションを模索するようになる」と分析し、AIへの投資対効果に対する市場の期待値そのものが再定義された。
安全性とデータプライバシー――正直に向き合うべきリスク
DeepSeekを利用する上で、安全性の議論は避けて通れない。以下に主要なリスク要因を整理する。
| リスク領域 | 具体的な懸念 |
|---|---|
| データ保管場所 | 全サーバーが中国国内に所在 |
| 法的リスク | 中国当局がユーザーデータの提出を要求可能(ユーザー通知義務なし) |
| 暗号化の脆弱性 | ハードコードされた暗号鍵、一部通信が非暗号化 |
| 外部連携 | ByteDance(TikTok親会社)のVolcengineとの通信が確認済み |
| データ漏洩事故 | Wiz社が認証なしで公開されたDB(チャット履歴・APIキー含む100万件超)を発見 |
| コンテンツ検閲 | 天安門事件・台湾の主権など政治的トピックに対する回答制限 |
各国政府の対応も厳しい。イタリアはGDPR不適合を理由にアプリストアからのブロックを実施し、オーストラリア・台湾・韓国も公的機関での使用を禁止した。米国ではNASA・国防総省・海軍・下院がそれぞれ独自に利用禁止措置を講じている。
これらのリスクを踏まえた上で、利用シーン別の推奨アプローチは以下の通りである。
| 利用シーン | 推奨アプローチ | リスクレベル |
|---|---|---|
| 個人的な調査・学習 | Web版で十分 | 低〜中 |
| 業務での文書作成 | API版(機密情報は入力しない) | 中 |
| 機密データの処理 | ローカル版(Ollama経由) | 低 |
| 政府・防衛関連 | 利用非推奨 | 高 |
もっとも安全な選択肢はOllamaを使ったローカル実行である。オープンソース(MITライセンス)のモデルをローカル環境にダウンロードして使えば、データは一切外部に送信されない。プライバシーが最重要な業務では、この方法を強く推奨する。
他の主要AIモデルとの使い分け
DeepSeekはあらゆる場面で最適というわけではない。用途に応じた使い分けの指針を示す。
| 用途 | 推奨モデル | 理由 |
|---|---|---|
| 数学・論理推論 | DeepSeek R1 | CoT可視化、IMO金メダル相当の数学力 |
| 大量テキスト処理 | DeepSeek V3系 | 圧倒的なコスト優位性 |
| クリエイティブ生成 | Claude 3.5 / GPT-4o | 文体の多様性・安全性ガードレールの成熟 |
| リアルタイム検索連携 | Gemini / Perplexity | 検索統合のネイティブ対応 |
| 日本語の繊細なニュアンス | GPT-4o / Claude | 日本語学習データの質と量 |
| エッジ/組み込みデバイス | DeepSeek R1蒸留版 | 7B〜14Bで高い推論力を発揮 |
ChatGPT vs Geminiの比較やAI APIの料金比較については、当サイトの関連記事でも詳しく解説しているため、あわせて確認してほしい。
実践的な活用シーン5選
DeepSeekの特性を活かした具体的な活用例を紹介する。
| 活用シーン | 使うモデル | ポイント |
|---|---|---|
| コードレビュー・デバッグ | V3系 API | 128Kコンテキストで長大なコードベースを一括分析 |
| 論文要約・文献調査 | R1 Web版 | 推論チェーンで論理構造を把握 |
| バッチ翻訳パイプライン | V3系 API | キャッシュヒット活用で翻訳コストを極限まで削減 |
| 社内ナレッジベース | ローカル版 + RAG | 機密文書を外部送信せずにQAシステム構築 |
| 教育・学習支援 | R1 Web版 | 思考過程の可視化が学習者の理解を促進 |
特にバッチ処理やRAG(検索拡張生成)との組み合わせにおいて、コストパフォーマンスの高さが際立つ。社内ドキュメントを対象としたQAシステムをローカル版で構築すれば、月額コストゼロでGPT-4級の回答品質を実現できる。
DeepSeekの今後――V4とマルチモーダルの展望
DeepSeekの進化は止まらない。2025年末〜2026年にかけて、複数の重要なマイルストーンが見込まれている。
| 予定・噂 | 内容 |
|---|---|
| DeepSeek-V3.2 Speciale | 長文制約を緩和し、IMO・IOI金メダル級の性能 |
| DeepSeek-V4(開発中) | 1兆パラメータMoE、100万トークンコンテキスト、ネイティブマルチモーダル |
| ツール連携の強化 | V3.1でエージェント構築・検索連携が大幅改善済み |
| コミュニティ拡大 | Hugging Faceでのモデル公開、Ollamaでのワンコマンド実行 |
V3.1以降、DeepSeekは単なるチャットAIから「AIエージェントのバックボーン」へと進化しつつある。ツール呼び出し性能はV3-0324やR1-0528を上回り、複数ツールを連携させる自律的なワークフロー構築が現実的になっている。
オープンソースかつ低コストという特性は、スタートアップや個人開発者にとって特に強力な武器だ。米国の大手モデルに依存しないAI戦略を立てたい組織にとっても、DeepSeekは無視できない選択肢になりつつある。
あなたはDeepSeekをどう使うか
DeepSeekは「安い・速い・オープン」という三拍子を揃えたモデルであり、特にコスト効率とローカル実行の自由度において、他の主要モデルを明確に上回る。一方で、中国国内にサーバーがあるという事実、データプライバシーの懸念、政治的トピックへの検閲といった制約も現実として存在する。
技術力は本物だ。ベンチマークではGPT-5級のスコアを叩き出し、オープンソースコミュニティでの採用も急拡大している。しかし、「どこで・何に・どう使うか」を自分自身で判断する責任は、利用者の側にある。
Web版で手軽に体験するか。API版でコスト効率を追求するか。それともOllamaでローカル実行し、データを完全に手元に留めるか。あなた自身のプライバシー基準、業務要件、技術スキルに照らして、最適な使い方は何だろうか。
