ソフトウェア開発の現場では、コードが正しく動くかどうかだけでなく、「そもそも作ろうとしていたものを正しく作れているか」の確認に膨大な手間がかかっている。BazがAmazon Bedrock上に構築したSpec Reviewエージェントは、この検証対象をコードの文法から製品の意図やデザイン仕様まで拡張し、AIによるコードレビューの定義そのものを変えようとしている。

この記事を一言でいうと

BazはAmazon Bedrock AgentCoreを使って、コードの構文チェックにとどまらず、Figmaのデザイン仕様やJiraの要件定義と実際の動作を照合するAIコードレビューエージェントを開発した。コードレビューが「仕様を満たしているか」の検証にまで範囲を広げた点が新しい。

なぜ話題なのか

従来のコードレビューは、コードがコンパイルできるか、構文的に問題がないかという視点に限定されがちだった。機能が仕様通りに動くか、デザイン意図と一致しているかは、QAチームがプレビュー環境で手動クリックを繰り返して確認するか、リリース後に初めて判明するというのが一般的な開発現場の実情だ。

開発速度が上がるほど、この手動検証がボトルネックになる。BazがAmazon Web Services(AWS)上に構築したSpec Reviewエージェントは、FigmaやJiraから取得した要件情報をもとに、実際のアプリケーションのDOM(Document Object Model)を解析し、イベントをシミュレーションし、設計と実装の一致を自動検証する。コードレビューに「仕様との突合」というレイヤーを組み込んだ点で、開発自動化の新しい領域を開いている。

一般読者や企業にどう関係するのか

ソフトウェアを使う側にとって、この技術は「仕様と違うものが届くリスク」を減らすことに直結する。開発企業にとっては、QA工数の圧縮だけでなく、設計意図と実装のズレをコードレビュー段階で検出できるため、手戻りコストの削減が期待できる。

日本企業のソフトウェア開発においても、ウォーターフォール型開発における要件定義書と実装の乖離や、デザインシステムと実装の不一致は長年の課題だ。Amazon Bedrockは2025年現在、AWS東京リージョンでも利用可能であり、こうした仕様検証型のAIエージェントを国内開発パイプラインに組み込む技術的な障壁は下がっている。とくに金融機関や製造業など、仕様の正確な反映が事業リスクに直結する領域では、導入の動機が強い。

AI業界の構造で見ると何が変わるのか

この事例の本質は、AIエージェントの「評価対象」がコードから製品体験に移行したことにある。Amazon Bedrock AgentCoreが提供するブラウザツールは、エージェントが人間のようにブラウザを操作し、DOMを読み取り、動的な検証を行うことを可能にしている。

これによって、AIコードレビューツールの競争軸が変化する。GitHub CopilotやCodeRabbitのような従来型ツールがコードの記述品質やバグ検出を主戦場としてきたのに対し、今後は「仕様・デザイン・実装の三者を横断的に検証できるか」が次の差別化要因になる。AWSがAgentCoreという形でクラウドネイティブなエージェント実行環境を提供していることは、この領域での競争を加速させる。

また、FigmaやJiraといった開発ツールとのAPI連携が、AIエージェントにとっての「情報源」として再定義されている点も見逃せない。設計データを保持するツール群が、単なるコラボレーションツールから、AIエージェントが検証の根拠とする「信頼できる一次情報源」へと役割を変えつつある。

一次情報から確認できる事実

Amazon Web Servicesの公式ブログ記事から、以下の事実が確認できる。

  • Bazはコードレビューを「コードの構文チェック」から「製品仕様やデザイン意図との一致検証」へ拡張するためにSpec Reviewエージェントを開発した
  • エージェント起動時にFigma(MCP経由)とJira(REST API経由)から要件情報を並列取得し、要件ごとにサブエージェントを生成する
  • サブエージェントはソースコードの確認に加え、Amazon Bedrock AgentCoreのブラウザツールを使って一時環境での動的検証(DOM解析、イベントシミュレーション、ビジュアルテスト)を実行する
  • 従来の手動QAプロセスに比べ、仕様と実装の不一致を早期に検出し、リグレッションのリスク低減と開発速度の向上に寄与している

関連企業・関連技術

  • Amazon Web Services: Amazon BedrockおよびAmazon Bedrock AgentCoreを提供。エージェントがブラウザを操作する実行基盤をクラウドサービスとして提供している
  • Baz: 従来のdiffベースのコードレビューを超え、仕様検証型のAIコードレビューを実用化した企業。本件の主体
  • Figma: デザインツール。エージェントがMCP(Model Context Protocol)経由でデザイン仕様を取得する情報源として機能
  • Atlassian(Jira): プロジェクト管理・要件管理ツール。REST API経由で要件情報を提供する情報源として機能
  • 競合領域: GitHub Copilot、CodeRabbit、CodiumなどのAIコードレビューツール全般。今後、仕様検証機能の有無が競争軸に加わる可能性がある

今後の論点

  • ブラウザ操作を伴う動的検証の信頼性や再現性が、エンタープライズグレードの品質保証プロセスに耐えうるレベルに達しているか
  • FigmaやJiraなど、サードパーティツールのAPIに依存するアーキテクチャが、ツール側の仕様変更やAPI制限の影響をどう受けるか
  • 仕様検証型のコードレビューを導入した場合、QAチームの役割が「検証実行者」から「検証ルールの設計者」へどのように移行するか
  • AWSに依存しない形で同様の仕様検証エージェントを構築する場合、どのような技術選択肢があり、どの程度の開発コストが発生するか