CoreWeaveは2025年3月、NVIDIA GB200 NVL72システムの大規模稼働を開始したと発表した。顧客としてIBM、Cohere、Mistral AIの名前が明示され、単なる技術発表ではなく商用サービスとして即時に提供される点が際立つ。GPU特化クラウド事業者が、汎用クラウド大手より先に次世代アーキテクチャの本格運用を顧客に提供した事実は、AIインフラの調達構造と競争軸が変化していることを示している。

背景

NVIDIAのGB200 NVL72は、1ラックに72基のBlackwell GPUと36基のGrace CPUを搭載し、NVLinkで単一の巨大な演算ユニットとして機能する設計である。最大の特徴は、従来別々だったGPUメモリ空間を統合し、30TB超の統一メモリとして扱える点にある。大規模言語モデルの推論で課題となるKVキャッシュのメモリ制約が大幅に緩和され、数千億パラメータ級のモデルでも単一インスタンスでの推論が現実的になる。

このタイミングでのCoreWeaveによる商用化が重要なのは、GB200の出荷開始からわずか数カ月で顧客提供に至ったスピードである。通常、新アーキテクチャの大規模クラスタ展開には検証と最適化に半年から1年を要する。CoreWeaveがこれを短期間で実現できたのは、同社がGPUワークロードに特化したデータセンター設計と電力インフラを先行整備していたからだ。

構造

CoreWeaveの顧客リストはGPU特化クラウドの産業的位置づけを明確に示している。IBMは自社のwatsonxプラットフォームや企業向けAI導入支援で大規模推論基盤を必要としており、汎用クラウドとは別のGPU供給源を確保する狙いがある。CohereはコマンドRシリーズなど企業向け大規模言語モデルを開発するAI企業であり、 Mistral AIは欧州発のモデルプロバイダーとしてMistral LargeやLe Chatの推論基盤を拡充している段階だ。

3社に共通するのは、いずれも汎用クラウド上でモデルを動作させるだけでなく、より低コストでGPU密度の高い専用環境を求めている点である。ここに、AWS、Google Cloud、Microsoft Azureとは異なる「特化型インフラレイヤー」としてのCoreWeaveの役割が浮かび上がる。NVIDIAがBlackwell世代で推進する企業向けDGXクラウドサービスとも補完関係にあり、NVIDIAのハードウェア戦略にとってCoreWeaveはパブリッククラウド向けのショーケース兼供給パイプラインとして機能している。

CoreWeaveの資金調達と調達力を支える構造も明確だ。同社はNVIDIA H100調達時にGPUそのものを担保とした数十億ドル規模の債務調達を実行し、Blackwell世代でも同様の金融手法を適用したとアナリストは推測している。GPUという物理資産の高い再販価値と需要の持続性が、従来のデータセンター向け融資とは異なる資金調達構造を可能にしている。

影響

GB200 NVL72の商用提供開始は、AI推論の経済性を変える転換点となる。単一インスタンスで超大規模モデルの推論が完結することで、モデル分割や複数ノード間通信のオーバーヘッドが不要になり、レイテンシと運用コストが大幅に低減する。1クエリあたりの推論コストはH100世代と比較して最大で数分の1になるとの試算もある。

さらに重要なのは、供給網の階層化が加速する点だ。汎用クラウド大手が自社チップ開発とNVIDIA GPUの両方を扱う中、CoreWeaveのようなGPU純粋特化事業者が最上位アーキテクチャへの最短アクセス権を提供する構図が定着しつつある。モデル開発企業にとっては、どのクラウド上で訓練するかだけでなく、どのインフラ特化事業者を選ぶかがコスト競争力に直結する時代に入った。

日本市場への影響として、さくらインターネットやKDDIなど国内クラウド事業者によるGPU調達戦略にも波及する可能性がある。GB200 NVL72のような高密度システムを国内データセンターで運用するには電力容量や冷却設備の制約が課題となるが、特化型事業者とNVIDIAの協業モデルは、国内通信事業者が独自にデータセンター改修を行うよりも投資効率が高い選択肢となりうる。

今後の論点

最初の論点は、GB200 NVL72の稼働率と実際のパフォーマンスデータの開示である。NVIDIA発表の理論値と実運用環境でのスループットには乖離が生じうる。CohereやMistral AIがどの程度のモデル規模で実運用に移行するかが重要な指標となる。

第二に、CoreWeaveのIPO後の資本効率とGPU調達能力の持続性である。同社は2025年の新規株式公開を予定しており、公開市場での評価額と債務返済スケジュールがBlackwell世代の拡大投資に制約を与える可能性がある。NVIDIAがDGXクラウドを自社で強化した場合、CoreWeaveとの競合関係が顕在化するかどうかも注目される。

第三に、GB200アーキテクチャが推論専用ワークロードに特化する中で、訓練用途のH200との二層構造がどのように価格差として現れるかである。訓練には依然として大規模クラスタが必要だが、推論はよりコンパクトなNVL72単位で完結するため、AIインフラの課金体系が「訓練向け」「推論向け」で明確に分岐する可能性がある。