空行 NVIDIAは3月28日、AIエージェント専用に設計した初のCPU「Vera」を、Anthropic、OpenAI、SpaceXAIの3研究所とOracle Cloud Infrastructureへ直接配送した。この動きは、AI処理の主役がGPUから専用CPUへと広がり始めた転換点である。
今回の配送は通常のサンプル提供ではない。NVIDIAのハイパースケール・HPC担当副社長Ian Buck氏が自ら配送を担当し、発表資料では各研究所の所在地を「San Francisco」「Mission Bay」「Palo Alto」と具体的に記載した。供給先の顔ぶれを見れば、これが単なるハードウェア発表ではなく、エージェント時代の基盤競争における陣取り合戦だと理解できる。
CPUに着目する必然
NVIDIAと言えばGPUである。ではなぜ今CPUなのか。背景には、AIエージェントが要求するワークロードの変化がある。現在の大規模言語モデルは推論時にGPUの並列演算能力に依存するが、エージェントが実用化されると事情が変わる。エージェントは連続的な意思決定、外部ツールの呼び出し、状態管理を繰り返すため、高スループットより低レイテンシと逐次処理性能が重要になる。GPUはこの種の処理を苦手とする。
Veraはこのギャップを埋める製品であり、NVIDIAのArmベースCPU戦略の中核に位置する。従来のGrace CPUがデータセンター向け汎用処理を担ってきたのに対し、Veraはエージェントの推論パイプライン最適化に焦点を絞っている。技術詳細は未公開だが、発表資料に「Built for Agents」と明記された事実が、その設計思想を端的に示す。
配送先が示すレイヤー戦略
今回の配送先を産業構造の観点から読むと、NVIDIAの意図は明確である。Anthropic、OpenAI、SpaceXAIの3社は、エージェント技術の最前線で競争するモデル開発企業だ。彼らに最初の実機を渡すことは、エージェント開発フレームワークのNVIDIA最適化を事実上決定づける。モデル開発企業がVera上でエージェントを設計すれば、そのエコシステム全体がNVIDIAのハードウェアに依存する構造が生まれる。
一方、Oracle Cloud Infrastructureへの提供は別の意味を持つ。クラウド事業者への早期供給は、エンタープライズ市場にエージェント推論基盤を浸透させる導線となる。AWSもGoogle CloudもMicrosoft Azureも、現在はGPUインスタンスの拡充に注力しているが、エージェント専用CPUインスタンスというカテゴリーが成立すれば、クラウド競争の軸が変わる可能性がある。
NVIDIAのIan Buck氏が自ら配送した行為は象徴的だ。通常、VPクラスが検証用チップの配送に直接関与することは稀であり、これが単なる技術供与ではなく戦略的パートナーシップの確立行為であることを示唆する。
市場が直面する構造変化
Veraの登場は、AI半導体市場の将来構造に二つの影響を与える。第一に、推論処理の分極化である。訓練にはGPU、推論には一部を専用CPUという分担が進めば、現在9割超とされるNVIDIAのAI半導体シェアはGPU市場に限定され、CPUセグメントでは新たな競争が始まる。ただし現時点では、そのCPU市場もNVIDIAがVeraで押さえにかかっている構図だ。
第二に、AIエージェントのコスト構造が変わる。現在のエージェント実装はGPU推論に依存するため、1タスクあたりの処理コストが高い。タスクの性質に応じてCPUとGPUを使い分けるアーキテクチャが普及すれば、エージェント運用コストは大幅に低下し、ビジネス導入の閾値が下がる。アナリスト予測では、エージェント専用ハードウェアがエンタープライズ導入率を2027年までに現状の3倍に押し上げるとの見方もある。
日本市場にとっては、この動きがクラウド経由で波及する点に注目すべきだ。Oracle Cloud Infrastructureは日本のデータセンターリージョンを持ち、AIワークロード向けの投資を加速している。Vera搭載インスタンスが東京または大阪リージョンで提供されれば、日本のエンタープライズ企業がエージェントを導入する際のレイテンシとデータ主権の問題が緩和される。国内SIerやクラウドインテグレーターは、GPU最適化とは異なるスキルセットを要求されることになり、人材育成とパートナー戦略の見直しが急務となる。
Veraの供給網と次なる焦点
Veraの量産スケジュールと供給可能数はまだ公表されていない。NVIDIAの発表によると、現在配送されたのは「最初のVera CPU」であり、検証用の限定的なロットである。ここから量産までに解決すべき課題は複数ある。Armアーキテクチャのライセンス条件、TSMCの製造キャパシティ、そしてGrace CPUとの生産ライン共有の可否である。
次に注目すべきは、3ヶ月以内に発表が見込まれる各研究所からのベンチマークデータだ。特にAnthropicのClaudeやOpenAIのGPTシリーズを用いたエージェントタスクにおいて、GPU比でのレイテンシと消費電力が焦点となる。Oracle Cloud Infrastructureが公式ブログで公開するであろうインスタンス仕様も、エンタープライズ導入を判断する材料として重要度が高い。
NVIDIAの真の狙いは、エージェント時代のフルスタック支配にある。GPUで訓練し、Veraで推論し、NIMマイクロサービスでデプロイし、CUDAで最適化する。この垂直統合が完成すれば、AI基盤のレイヤー別競争は意味を失い、NVIDIAのプラットフォームそのものがAIのインフラストラクチャとなる。Veraはその設計図における最後の空白を埋める部品である。