2026/3/10|更新: 2026/5/12

Claude Codeに「Code Review」が登場 ── マルチエージェントが全PRのバグを自動検出

Q: 何が起きたのか

Anthropicは2026年3月10日、開発者向けコーディングツール「Claude Code」に新機能「Code Review」をリリースした。GitHubのプルリクエスト（PR）が作成されるたびに、複数のAIエージェントが自動的に起動してコードを解析し、バグ・脆弱性・エッジケースを検出する。 現在は「研究プレビュー」として、Claude TeamsおよびEnterpriseプランのユーザーに提供されている。 従来のリンター（静的解析ツール）がコードのスタイルやフォーマットを検査するのに対し、Code Reviewはロジックの正しさに焦点を当てる。コードが「動くかどうか」ではなく「正しく動くかどうか」を深く検証する設計だ。 https://x.com/claudeai/status/2031088171262554195

Updateニュース

TechCreate編集部·8分で読める

この記事でわかること

Anthropicが2026年3月10日、Claude Codeに新機能「Code Review」をリリース

PR作成時に複数のAIエージェントが並列でコードを解析する設計

Normal・Nit・Pre-existingの3段階で指摘を重要度ランク付け

Anthropic社内では1行変更から認証バイパスバグを検出した実績がある

CLAUDE.md / REVIEW.mdでレビュー内容をリポジトリごとにカスタマイズ可能

対象はTeams/Enterprise、平均コスト$15〜25、レビュー時間は約20分

何が起きたのか

Anthropicは2026年3月10日、開発者向けコーディングツール「Claude Code」に新機能「Code Review」をリリースした。GitHubのプルリクエスト（PR）が作成されるたびに、複数のAIエージェントが自動的に起動してコードを解析し、バグ・脆弱性・エッジケースを検出する。

現在は「研究プレビュー」として、Claude TeamsおよびEnterpriseプランのユーザーに提供されている。

従来のリンター（静的解析ツール）がコードのスタイルやフォーマットを検査するのに対し、Code Reviewはロジックの正しさに焦点を当てる。コードが「動くかどうか」ではなく「正しく動くかどうか」を深く検証する設計だ。

マルチエージェントが動く仕組み

Code Reviewの中核は、複数の専門エージェントを並列で走らせるマルチエージェントアーキテクチャにある。

ArchitectureClaude Code Review

マルチエージェント・レビューの仕組み

PRごとに複数の専門エージェントが並列起動し、検証・ランキングを経てコメントを投稿する5段階プロセス

🔀

Step 1PR Open / Push

PRの作成またはプッシュをトリガーとしてレビューが自動起動

🤖

Step 2Agent Fleet Dispatch

複数の専門エージェントが並列で起動。各エージェントが異なるクラスのバグを探索

🔍

Step 3Verification

検証ステップで候補バグをコードの実際の動作と照合。偽陽性をフィルタリング

📊

Step 4Severity Ranking

検出結果を重複排除し、重要度で3段階にランキング

💬

Step 5PR Comment

概要コメント＋インラインコメントとしてPRに直接投稿。承認・ブロックはしない

重要度レベル（Severity）

🔴

Normal

マージ前に修正すべきバグ

🟡

Nit

修正推奨だがブロッキングではない軽微な問題

🟣

Pre-existing

このPRで導入されたものではない既存バグ

平均レビュー時間：約20分 ── 各指摘には折りたたみ式の推論セクション付き

レビューの流れは次の5段階で進む。

1. トリガー ── PRの作成（またはプッシュ）を検知すると、Anthropicのインフラ上で自動的にレビューが起動する。開発者側の設定は不要だ。

2. エージェント群の並列探索 ── 変更されたコードだけでなく、リポジトリ全体のコンテキストを参照しながら、複数のエージェントがそれぞれ異なるクラスの問題を探す。大規模なPR（1,000行超）には多くのエージェントが割り当てられ、小規模なPR（50行未満）には軽量な処理が適用される。

3. 偽陽性フィルタリング ── 検出された候補バグは、検証ステップでコードの実際の振る舞いと照合される。このステップが、不要なノイズを排除する鍵になる。

4. 重要度ランキング ── 検証を通過した指摘は重複排除され、3段階の重要度でランク付けされる。

🔴 Normal ── マージ前に修正すべきバグ
🟡 Nit ── 修正推奨だがブロッキングではない軽微な問題
🟣 Pre-existing ── このPRで導入されたものではない既存バグ

5. コメント投稿 ── 結果はPRにインラインコメント＋概要コメントとして投稿される。各指摘には折りたたみ式の「拡張推論」セクションが付属し、なぜその問題が指摘されたのか、どう検証されたのかを確認できる。

重要なのは、Code ReviewはPRの承認やブロックを行わない点だ。既存のレビューワークフローはそのまま維持される。

Anthropic社内での導入実績

Anthropicは自社のエンジニアリングチームでCode Reviewを運用し、その効果を数値で示している。

DataAnthropic社内実績

Code Review の導入効果

Anthropic社内のエンジニアリングチームが実際にCode Reviewを運用した実績データ

導入前

16%

PRの実質的レビュー率

導入後

54%

3.4倍に増加

PR規模別の指摘率

大規模PR（1,000行超）84%

平均 7.5件の指摘

中規模PR54%

平均 3〜4件の指摘

小規模PR（50行未満）31%

平均 0.5件の指摘

✅

誤検出率 1%未満

「不正確」とマークされた指摘は全体の1%未満

出典：Anthropic公式ブログ「Code Review for Claude Code」（2026年3月）

もっとも印象的なのは、ある1行の変更から本番サービスの認証バイパスにつながるバグを検出した事例だ。通常であれば「1行の変更」として簡単に承認されがちな差分だが、Code Reviewがこれを重大な問題として検出した。担当エンジニアは「自力では見つけられなかっただろう」と振り返っている。

セットアップとカスタマイズ

初期設定

管理者が3ステップで設定を完了できる。

Claude Code管理画面でCode Reviewセクションを開く
GitHubアプリをインストールし、対象リポジトリを選択
リポジトリごとにレビュートリガーを設定

トリガーは2種類から選べる。

トリガー	動作	コスト
PR作成時のみ	PRのオープンまたはready for reviewの時点で1回実行	低い
プッシュごと	コミットのたびに実行。修正済みスレッドの自動クローズ付き	PR作成時のみ × プッシュ回数

CLAUDE.md / REVIEW.md によるカスタマイズ

Code Reviewの指摘内容は、リポジトリに配置する2つのファイルでカスタマイズできる。

CLAUDE.md ── Claude Code全体の共有プロジェクト指示。Code Reviewだけでなく、インタラクティブセッションにも適用される。新しく導入された違反はnit（軽微）レベルの指摘として報告される。

REVIEW.md ── レビュー専用のガイドライン。チームのスタイルガイド、フラグすべき項目、スキップすべき項目を記述する。

料金と対応プラン

項目	内容
対象プラン	Teams / Enterprise（研究プレビュー）
課金方式	トークン使用量ベース
平均コスト	$15〜25 / レビュー（PR規模に応じて変動）
平均レビュー時間	約20分
月次上限	管理画面で設定可能
分析ダッシュボード	レビュー数・週次コスト・フィードバック・リポジトリ別内訳

コストはAnthropic請求書に計上され、AWS BedrockやGoogle Vertex AIでの利用分とは別に請求される。

AI生成コード時代のレビューをどう変えるか

AIによるコード生成が普及するにつれ、レビューの負荷は増大の一途をたどっている。GitHub Copilotやclaude Codeのようなツールが大量のコードを生成する一方で、そのコードの品質を担保するのは依然として人間のレビュアーだ。

Code Reviewは、この「AIが書いたコードをAIがレビューする」という新しいレイヤーを提案している。これは人間のレビューを置き換えるものではなく、人間が見落としがちな深い論理エラーをキャッチする補助的な存在として位置づけられている。

また、ローカルでの事前レビューには code-review プラグインも用意されており、PRを開く前にターミナルからオンデマンドでレビューを実行できる。GitHub ActionsやGitLab CI/CDとの統合も可能だ。

ソース:

よくある質問（FAQ）

Q. 既存のリンターと何が違うのですか？

従来のリンターはコードのスタイルやフォーマットを検査する。

Code Reviewはロジックの正しさに焦点を当て、「動くかどうか」ではなく「正しく動くかどうか」を検証する。

変更箇所だけでなくリポジトリ全体のコンテキストを参照する点も異なる。

Q. Code ReviewはPRを自動で承認・ブロックしますか？

しない。

結果はPRにインラインコメントと概要コメントとして投稿されるだけで、既存のレビューワークフローはそのまま維持される。

人間のレビューを置き換えるのではなく、深い論理エラーをキャッチする補助役という位置づけだ。

Q. 費用はどのくらいかかりますか？

平均コストは1レビューあたり$15〜25でPR規模に応じて変動する。

課金はトークン使用量ベースで、Anthropic請求書に計上される。

月次上限は管理画面で設定でき、分析ダッシュボードで週次コストやリポジトリ別内訳も確認できる。

Q. どのプランで使えますか？

現在は研究プレビューとして、Claude TeamsおよびEnterpriseプランで提供されている。

プッシュごとに実行する設定も可能だが、PR作成時のみの実行と比べてコストが増える点に注意が必要だ。

ローカルでの事前レビュー用にcode-reviewプラグインも用意されている。

このような記事を毎週お届けします

メールアドレスだけで登録完了。いつでも解除できます。

タグ:#Claude

TechCreate編集部

TechCreateの編集チーム。AI・スタートアップ・エンジニアリングの最新動向を、分かりやすく深く掘り下げてお届けします。

※ AIを活用して取材・執筆を行うバーチャルジャーナリストです

この記事が参考になったら、シェアしてください。

Claude 4.5 vs GPT-5 vs Gemini 2.5——三大LLMの実力を徹底比較

Anthropic、ライバルMuskの巨人データセンターを丸ごと借り上げ。Claudeはコンピュート飢餓を脱するか

AlphabetがNvidiaの時価総額に肉薄——AI時代のテック企業ヒエラルキーが400億ドル差まで縮まった

週刊テックニュースレター