コーディングベンチマーク、1年で60%から"ほぼ満点"へ
報告書で最も注目を集めたのは、AIのソフトウェア開発能力の急伸だ。 コーディング品質を測るベンチマーク「SWE-bench Verified」のスコアは、2025年初頭の約60%から、2026年4月時点でほぼ100%に達した。 1年弱でこれほどの伸びを記録したのは前例がない。
加えて、人間の専門家レベルを想定して設計された難問集「Humanity's Last Exam」においても、AnthropicのClaude Opus 4.6やGoogleのGemini 3.1 Proが50%超を記録した。 PhD(博士)レベルの科学問題においても、AIは人間のベースラインを上回ったとされる。
米中格差が消滅、AI開発競争は拮抗局面へ
AI開発の主導権をめぐる米中の競争にも、新たな動きが見えてきた。 注目モデルの公表数は米国が2025年に50本とリードを保っているが、中国のモデルとの性能差はほぼ消滅しており、ランキングの首位は両国が交互に入れ替わっている状況だ。
かつては米国のAIモデルが明確な優位を持つ時期が続いたが、2025年以降その差は名目上のものに近い。 報告書は、AI開発の競争環境が「1強支配」から「多数拮抗の構造」へと移行しつつあると分析している。
普及速度、PCやインターネットを上回る
生成AIの社会普及速度もデータとして示された。 生成AIは登場から3年で世界人口の53%に普及したとされ、これはパソコン(PC)やインターネットの普及速度を大きく上回る。
企業・組織レベルでの導入率は2025年時点で88%に達しており、大学生の5人に4人が授業に生成AIを活用しているという。 AIはもはや一部のユーザー層の道具ではなく、社会インフラとしての側面を持ち始めている。
透明性スコアが急落、信頼と不安が同時上昇
AI企業の透明性を評価する「Foundation Model Transparency Index」のスコアは、前年の58点から40点へと急落した。 大規模モデルを持つ主要AI企業が、学習コードやデータセットの詳細、パラメータ数などの公開を控える傾向が顕著になっていることが背景にある。
一方、一般の人々のAIに対する感情は複雑だ。 「AIが社会に利益をもたらす」と楽観的に答えた人の割合は前年の52%から59%へ上昇した。 しかし同時にAIへの「不安感」も2%増加し52%に達しており、期待と懸念が同時に高まっている構図となっている。
AIが雇用市場に与える影響についての認識ギャップも際立っている。 米国の専門家の73%が「プラスの影響がある」と評価しているのに対し、一般市民でその見方を共有しているのはわずか23%にとどまる。 専門家と一般社会の間に深い溝が生じていることを、この数字は示している。
経済的利益の偏在とインシデントの増加
AIがもたらす経済的価値の集中も明らかになった。 PwCの調査によれば、AIがもたらす経済価値の74%は、全企業のうちわずか20%の「AIリーダー」企業が獲得しており、大多数の企業は依然として試験導入の段階にとどまっている。
安全性・リスクの面でも数字は悪化している。 2025年に記録されたAI関連インシデントの件数は362件に達し、2024年の233件から約55%増加した。
エネルギー消費の問題も看過できない規模になってきた。 世界のAIデータセンターが引き出せる電力は合計29.6ギガワットに相当し、これはニューヨーク市の最大需要時の電力消費に匹敵する。 OpenAIのGPT-4o単体の年間水消費量は、1200万人の飲料水需要を超える可能性があるとも報告書は指摘している。
能力、普及、経済効果いずれの軸でもAIの成長は続いている。 しかし透明性の後退と社会の懸念の高まりは、技術の進化とガバナンスの乖離を浮き彫りにしている。 「AI Index 2026」は、AIをめぐる課題が技術的なものから社会的・政治的なものへと重心を移しつつあることを示す報告書だった。
ソース: