コーディングベンチマーク、1年で60%から"ほぼ満点"へ
報告書で最も注目を集めたのは、AIのソフトウェア開発能力の急伸だ。 コーディング品質を測るベンチマーク「SWE-bench Verified」のスコアは、2025年初頭の約60%から、2026年4月時点でほぼ100%に達した。 1年弱でこれほどの伸びを記録したのは前例がない。
加えて、人間の専門家レベルを想定して設計された難問集「Humanity's Last Exam」においても、AnthropicのClaude Opus 4.6やGoogleのGemini 3.1 Proが50%超を記録した。 PhD(博士)レベルの科学問題においても、AIは人間のベースラインを上回ったとされる。
米中格差が消滅、AI開発競争は拮抗局面へ
AI開発の主導権をめぐる米中の競争にも、新たな動きが見えてきた。 注目モデルの公表数は米国が2025年に50本とリードを保っているが、中国のモデルとの性能差はほぼ消滅しており、ランキングの首位は両国が交互に入れ替わっている状況だ。
かつては米国のAIモデルが明確な優位を持つ時期が続いたが、2025年以降その差は名目上のものに近い。 報告書は、AI開発の競争環境が「1強支配」から「多数拮抗の構造」へと移行しつつあると分析している。
普及速度、PCやインターネットを上回る
生成AIの社会普及速度もデータとして示された。 生成AIは登場から3年で世界人口の53%に普及したとされ、これはパソコン(PC)やインターネットの普及速度を大きく上回る。
企業・組織レベルでの導入率は2025年時点で88%に達しており、大学生の5人に4人が授業に生成AIを活用しているという。 AIはもはや一部のユーザー層の道具ではなく、社会インフラとしての側面を持ち始めている。
透明性スコアが急落、信頼と不安が同時上昇
AI企業の透明性を評価する「Foundation Model Transparency Index」のスコアは、前年の58点から40点へと急落した。 大規模モデルを持つ主要AI企業が、学習コードやデータセットの詳細、パラメータ数などの公開を控える傾向が顕著になっていることが背景にある。
一方、一般の人々のAIに対する感情は複雑だ。 「AIが社会に利益をもたらす」と楽観的に答えた人の割合は前年の52%から59%へ上昇した。 しかし同時にAIへの「不安感」も2%増加し52%に達しており、期待と懸念が同時に高まっている構図となっている。
AIが雇用市場に与える影響についての認識ギャップも際立っている。 米国の専門家の73%が「プラスの影響がある」と評価しているのに対し、一般市民でその見方を共有しているのはわずか23%にとどまる。 専門家と一般社会の間に深い溝が生じていることを、この数字は示している。
経済的利益の偏在とインシデントの増加
AIがもたらす経済的価値の集中も明らかになった。 PwCの調査によれば、AIがもたらす経済価値の74%は、全企業のうちわずか20%の「AIリーダー」企業が獲得しており、大多数の企業は依然として試験導入の段階にとどまっている。
安全性・リスクの面でも数字は悪化している。 2025年に記録されたAI関連インシデントの件数は362件に達し、2024年の233件から約55%増加した。
エネルギー消費の問題も看過できない規模になってきた。 世界のAIデータセンターが引き出せる電力は合計29.6ギガワットに相当し、これはニューヨーク市の最大需要時の電力消費に匹敵する。 OpenAIのGPT-4o単体の年間水消費量は、1200万人の飲料水需要を超える可能性があるとも報告書は指摘している。
能力、普及、経済効果いずれの軸でもAIの成長は続いている。 しかし透明性の後退と社会の懸念の高まりは、技術の進化とガバナンスの乖離を浮き彫りにしている。 「AI Index 2026」は、AIをめぐる課題が技術的なものから社会的・政治的なものへと重心を移しつつあることを示す報告書だった。
ソース:
- The 2026 AI Index Report — Stanford HAI
- Inside the AI Index: 12 Takeaways from the 2026 Report — Stanford HAI
- Stanford's AI Index 2026 shows rapid progress, growing safety concerns, and declining public trust — The Decoder (2026年4月15日)
- The Stanford AI Index 2026 Is Out — Analytics Drift
AIインデックスが映す産業の成熟
Stanford のAIインデックスは、AI研究と産業応用の進展を毎年追跡している。
2026年版で特に注目されるのは、研究成果の商用化速度、企業によるAI導入の浸透率、各国の政策対応のばらつきだ。
これらの指標は、AIが一過性のブームではなく、長期的に社会構造を変える基盤技術として定着したことを裏付けている。
測定の限界と今後の指標
現在のAIインデックスでも、社会的影響、倫理、労働市場への波及などは、十分には測定できていない。
今後は、AIによる格差、教育の変化、創造性の分布、ガバナンス指標などが新しい柱として追加されていく可能性が高い。
あなたの組織は、AIの導入度合いを、単純な利用率ではなく、どんな指標で評価しているだろうか。
指標から戦略へ
AIインデックスのような指標は、読むためではなく意思決定のために使ってこそ価値がある。
自社の投資、採用、プロダクト設計、組織設計。
どれに、どの指標を、どう反映させるか。
指標を眺めるだけで満足すると、経営の判断速度が落ちていく。
あなたの組織は、AIインデックスをどの会議の素材として使っているだろうか。
自社のAI成熟度を測る
業界全体の指標と並行して、自社のAI成熟度を定期的に測る仕組みを持つと、戦略の調整がしやすくなる。
採用、投資、社内活用、ガバナンス。
それぞれの軸で現在地を言語化する習慣を持つ組織は、変化への適応が速い。
指標の先にある物語
AIの進化は数字で語られることが多いが、本当の変化はその数字の向こうにある人々の働き方と暮らしに宿る。
指標を読み解きつつ、その背後にある物語にも耳を澄ます姿勢を持ちたい。