AI向けクラウド基盤のCoreWeaveが、NVIDIA GB200 NVL72とGB300 NVL72を用いたMLPerf 6.0の推論ベンチマークでDeepSeek R1モデルを動作させ、主要な指標でリーダーシップを獲得した。オフラインモードでの計測は、バッチ処理や非同期推論における実用性能の高さを示しており、クラウド事業者がAIインフラ層で優位に立つ構図を一段と明確にしている。今回の結果は、AI性能評価の共通尺度がメガクラウドからGPU特化型へと移りつつある転換点である。
背景
MLPerfは業界横断で設計されたAIベンチマークであり、推論性能を公平に比較できる数少ない指標として重視されてきた。従来は大手パブリッククラウドが主導する形でH100やA100世代の結果が公表されてきたが、6.0ラウンドではBlackwell世代のGB200 NVL72が初めて本格参戦し、その結果をGPU特化型クラウドのCoreWeaveが独占するかたちとなった。
ベンチマーク対象がDeepSeek R1という中国発のオープンウェイトモデルである点も見逃せない。同モデルは推論時に極めて長大なコンテキスト処理を要し、単純なトークン生成速度よりメモリ帯域とノード間通信の品質が問われる。GB200 NVL72はNVLinkを用いた72基のGPU密結合が可能であり、このアーキテクチャの優位性を顕在化させた。MLCommonsの公開データによると、オフラインシナリオでCoreWeaveは1秒あたりのサンプル処理件数でトップを維持している。
この結果が意味するのは、生成AIの推論ワークロードにおいてハードウェアとクラウド基盤の一体設計が直接的な競争力になっていることだ。汎用クラウドの仮想化層を挟む構造では、GPU間のメモリ共有や低レイテンシ通信の点でGB200の性能を最大限引き出しにくく、CoreWeaveの物理基盤に近い提供形態がベンチマークスコアの差として表れた形である。
構造
今回の計測環境はNVIDIAの最新GPUアーキテクチャBlackwellに依存しており、CoreWeaveのインフラ調達と展開速度がNVIDIAとの関係性の深さを反映している。CoreWeaveは2023年以降、NVIDIAから優先的にH100を確保し、続いてGB200の初期割当を受けたと複数の業界アナリストが推定する。2025年に入ってGB300のテスト環境までMLPerfに提出できる体制は、サプライチェーン上流への食い込みが他社より早い証左である。
DeepSeek R1のオフラインモード実行には、大規模なメモリプールとモデル並列化が不可欠で、GB200ではNVSwitchを介したGPUメモリの論理統合が効力を発揮した。従来世代で問題になりやすかったバス帯域のボトルネックが大幅に緩和され、数千トークン単位のバッチ処理を安定的に完了できる。CoreWeaveのパフォーマンス開示手法は、単なるスペック競争ではなく、実契約につながるオフライン推論のSLA提示というビジネス色が強い。同社はIPOを控えており、GB300までの連続的なリーダーシップ主張が機関投資家への技術検証材料として機能する。
影響
AI推論の供給網は、汎用クラウド、GPU特化型、モデル開発企業の3層で再編が進む。今回のMLPerf結果は、推論の高速化と低コスト化の両立がGPU特化型に傾斜する傾向を補強しており、CoreWeave、Lambda Labs、Crusoeといった専業事業者の市場交渉力が強まる。一方で、この構図はNVIDIAへの需給依存を一層濃くするため、GB200やGB300の供給量がクラウド間の競争格差を決定する状態が続く。
日本市場にとっては、推論クラウドの選択肢が物理的に限られる構造が改めて浮かび上がった。国内データセンターでは消費電力や冷却制約からGB200 NVL72の導入障壁が高く、国産クラウド事業者が同水準の推論速度を提供するのは短期的に困難だ。このギャップが広がると、国内スタートアップのAIサービス開発は海外GPUクラウドへの依存を強め、データ主権の確保や推論遅延の地理的課題に直面する可能性がある。NVIDIAのGPU供給戦略と各国のデータ規制の交差点に日本市場の死角が潜む。
今後の論点
今後の焦点は、GB300搭載機の単発性能の誇示から、持続的なパフォーマンスを運用で示せるかどうかに移る。MLPerfはあくまで制御された環境でのスナップショットであり、マルチテナント環境下でのスコア変動や障害耐性は別の尺度となる。投資家や大口顧客は、CoreWeaveがSLAベースの実稼働データをどこまで開示できるかを注視するだろう。
さらに、DeepSeek R1のようなオープンウェイトモデルが推論ベンチマークの標準ワークロードになると、中国発モデルがNVIDIA中心の評価基盤に乗る形となり、米中間のテクノロジー規制と実装現場の乖離が拡大する。輸出規制の枠組みとクラウド上のモデル流通の実態が噛み合わなくなれば、規制当局の新たな対応を促す可能性もある。MLPerf 6.0の結果は、単なる順位発表を超えてGPUサプライチェーンとモデル流通の再考を迫る触媒となる。