50語をどう選んだか
まず、本稿で取り上げる50語の選定方針を共有しておく。
選定基準
| 軸 | 内容 |
|---|---|
| 横断性 | エンジニア/非エンジニア問わず使われる用語を優先 |
| 鮮度 | 2024〜2026年に普及/意味が更新された用語を優先 |
| 実務性 | 単なるバズワードではなく、業務判断に必要な語を優先 |
| 体系性 | 「モデル → 学習 → 推論 → 評価 → 運用」の流れで網羅 |
逆に意図的に外したのは、「ディープラーニング」「ニューラルネット」など2010年代から定着した基礎用語、および「AGI」「ASI」のような哲学的議論寄りの未来語。新年度の実務に直結する語に絞っている。
カテゴリ1: モデルの種類と構造(7語)
| # | 用語 | 意味 |
|---|---|---|
| 1 | LLM(Large Language Model) | 大規模言語モデル。数百億〜数兆パラメータ規模のテキスト生成AI |
| 2 | LMM/VLM(マルチモーダル) | 画像・音声・動画も扱えるモデル。GPT-4o、Gemini、Claude等 |
| 3 | SLM(Small Language Model) | 数億〜数十億パラメータの小型モデル。エッジ・オンデバイス向け |
| 4 | MoE(Mixture of Experts) | 複数の専門サブモデルを動的に切り替える構造。Mixtralなど |
| 5 | 拡散モデル(Diffusion Model) | ノイズから画像・動画を生成する手法。Stable Diffusion系 |
| 6 | Transformer | 現代の生成AIの基盤アーキテクチャ。注意機構(Attention)が核 |
| 7 | 推論時計算(Test-Time Compute) | 推論時に思考を増やす手法。OpenAI o1系の概念 |
カテゴリ2: 学習・チューニング(6語)
| # | 用語 | 意味 |
|---|---|---|
| 8 | 事前学習(Pretraining) | 大規模データで基礎能力を獲得する初期段階 |
| 9 | ファインチューニング(Fine-tuning) | 用途別に追加学習させて専門化させる工程 |
| 10 | RLHF(人間のフィードバックによる強化学習) | 人間の選好を学習させてモデルを調整 |
| 11 | DPO(Direct Preference Optimization) | RLHFを簡略化した選好最適化手法 |
| 12 | 蒸留(Distillation) | 大型モデルの知識を小型モデルに移植する技術 |
| 13 | LoRA / QLoRA | 軽量にファインチューニングするためのパラメータ効率手法 |
カテゴリ3: 推論と入出力(7語)
| # | 用語 | 意味 |
|---|---|---|
| 14 | プロンプト(Prompt) | モデルへの指示文。質問、命令、文脈を含む |
| 15 | コンテキストウィンドウ | モデルが一度に扱える入力長。2026年は数百万トークン級も |
| 16 | トークン(Token) | テキストの分割単位。日本語は1文字≒1〜2トークン |
| 17 | Temperature | 出力のランダム性を制御するパラメータ |
| 18 | Top-p / Top-k | 出力候補の確率分布を絞り込む手法 |
| 19 | システムプロンプト | モデルの役割や制約を定義する基底指示 |
| 20 | Few-shot / Zero-shot | 例示の有無で出力を制御する手法 |
カテゴリ4: エージェントと外部接続(7語)
ここからが2025〜2026年に急速に普及した領域。実務の生産性に直結するため、特に重点的に押さえたい。
| # | 用語 | 意味 |
|---|---|---|
| 21 | AIエージェント | タスクを自律的に分解・実行するAI。ブラウザ操作・コード実行など |
| 22 | RAG(Retrieval-Augmented Generation) | 外部知識を検索して答えに反映させる仕組み |
| 23 | ベクトル検索 | 意味の近さで検索する技術。RAGの基盤 |
| 24 | ベクトルDB | 埋め込みベクトルを保存・検索するDB。Pinecone、Qdrantなど |
| 25 | エンベディング(Embedding) | テキストを数値ベクトルに変換した表現 |
| 26 | MCP(Model Context Protocol) | AIと外部ツール/データを繋ぐ標準プロトコル。Anthropic起点 |
| 27 | ツール呼び出し(Function Calling) | モデルが関数を選んで実行する仕組み |
特に26番のMCPは、2025年以降の生成AI実務における「インターネットにおけるHTTP」とも言える存在感を持ち始めている。社内データやSaaSをAIに繋ぐ標準プロトコルとして、新年度に押さえるべき最重要用語の1つだ。
カテゴリ5: 評価とベンチマーク(6語)
| # | 用語 | 意味 |
|---|---|---|
| 28 | ベンチマーク | モデル性能を比較する標準テスト。MMLU、HumanEval等 |
| 29 | LMArena | 人間の投票でモデルを比較する代表的アリーナ |
| 30 | ハルシネーション | モデルが事実と異なる情報を生成する現象 |
| 31 | 推論能力(Reasoning) | 多段階の論理を扱う能力。o1系で重視される指標 |
| 32 | エージェントベンチマーク | SWE-bench、WebArena等。実タスクでの能力評価 |
| 33 | レッドチーミング | 攻撃シナリオでモデルの脆弱性を検査する手法 |
カテゴリ6: 運用とインフラ(6語)
| # | 用語 | 意味 |
|---|---|---|
| 34 | 推論コスト | API呼び出しの料金。入出力トークン単価で計算 |
| 35 | レイテンシ | 応答までの遅延時間。ユーザー体験を左右する指標 |
| 36 | バッチ推論 | 複数リクエストを一括処理してコスト・速度を最適化 |
| 37 | ストリーミング | 出力を逐次配信する方式。チャットUIの体感速度を上げる |
| 38 | プロンプトキャッシュ | 同じ入力部分を再利用してコストを削減する仕組み |
| 39 | サーバーレスGPU | GPUを必要時だけ起動する課金モデル。Modal、RunPod等 |
カテゴリ7: 安全性とガバナンス(5語)
| # | 用語 | 意味 |
|---|---|---|
| 40 | アラインメント | モデルを人間の価値観・意図に沿わせる研究領域 |
| 41 | プロンプトインジェクション | 悪意ある指示でモデルの挙動を操作する攻撃 |
| 42 | データリーク | 学習データや機密情報がモデル経由で漏洩する事象 |
| 43 | AI Act / AI規制 | EU AI法など、AI利用を法的に枠付ける制度 |
| 44 | 透かし(Watermarking) | AI生成物を識別可能にする技術 |
カテゴリ8: 開発者の道具(3語)
| # | 用語 | 意味 |
|---|---|---|
| 45 | LLMOps | LLMの開発・運用・改善のためのプラクティス/ツール群 |
| 46 | Tracing / Observability | エージェントの動きを可視化・分析する仕組み |
| 47 | ガードレール | モデルの出力を安全側に矯正する制約レイヤー |
カテゴリ9: ビジネスサイドで頻出(3語)
| # | 用語 | 意味 |
|---|---|---|
| 48 | コパイロット型 / エージェント型 | 「補助する」AIと「自走する」AIの設計思想の違い |
| 49 | AIネイティブ企業 | 既存業務にAIを足すのではなく、AI前提で設計された組織 |
| 50 | ヒューマン・イン・ザ・ループ | 重要判断に人を介在させる運用設計 |
カテゴリ別の出現頻度マップ
50語をカテゴリ別に並べると、生成AIという領域の「重心」がどこにあるかが浮かび上がる。
カテゴリ4(エージェントと外部接続)と、カテゴリ7(安全性とガバナンス)が、2024年と比べて占有比率が大きく伸びている領域だ。技術と社会のあいだで、「AIをどう外に開き、どう守るか」が業界の中心テーマになっていることがわかる。
新年度に押さえる「最重要5語」
50語すべてを今すぐ覚える必要はない。優先順位をつけるなら、次の5語から押さえると効率が良い。
| 優先順位 | 用語 | なぜ重要か |
|---|---|---|
| 1 | コンテキストウィンドウ | 「AIに何をどれだけ渡せるか」の上限を決める |
| 2 | RAG | 社内データをAIに繋ぐ最頻出の構造 |
| 3 | AIエージェント | 2025〜2026年の業務生産性の主戦場 |
| 4 | MCP | 社内外システム連携の標準プロトコル |
| 5 | ハルシネーション | リスク管理・ガバナンスの基本概念 |
この5語は、エンジニア/非エンジニア問わず会議で頻出する。意味を自分の言葉で説明できるようにしておくと、新年度のキャッチアップが格段に楽になる。
結びに
用語は道具だ。覚えること自体が目的ではなく、それを使って意思決定の精度を上げ、組織の共通言語を作るための装置である。
2026年の生成AI業界は、もはや「使う/使わない」を議論する段階ではなく、「自社にどう組み込み、どう守るか」を設計する段階に入った。そのとき、用語の理解度の差が、そのまま意思決定スピードの差として現れる。
新年度のキャッチアップとして、まず5語、次に20語、最後に50語。あなたのチームは、どの段階から始めるだろうか。
