生成AIの学習と推論を支える物理インフラの分業が加速している。AI専業クラウド事業者CoreWeaveは、全施設でNVIDIA Quantum-2 InfiniBandネットワークと直接液冷を採用し、汎用クラウドでは実現しにくい高密度GPU環境を運営している。この設計判断は、AIワークロードの大規模化がデータセンターの冷却方式と通信規格の選定にまで波及している事実を示す。
汎用クラウド限界説とAI専用基盤の台頭
AI計算には数千基のGPUが同時に低遅延で協調する構造が不可欠だ。従来型クラウドの多くは汎用イーサネットと空冷を前提に設計されており、単一ラックあたりの消費電力が30kWを超える最新GPUには物理的に対応しきれない。NVIDIAのH100や次世代B200は1基あたり700Wから1000W級の熱設計電力を必要とし、空冷ではGPU密度を落とすか性能を制限せざるを得ない。CoreWeaveはこの制約を直接液冷で回避し、ラック単位の集積度と演算効率を引き上げている。
ネットワーク選択に現れたGPU調達の優先権
同社が全拠点でInfiniBandを標準採用する理由はGPU側の設計にある。NVIDIAはGPU間通信プロトコルNVLinkとネットワーク規格InfiniBandを一体的に最適化しており、AIクラスタ全体の実効性能はネットワーク帯域とレイテンシで決定的に左右される。2023年にNVIDIAがCoreWeaveへ戦略出資したことで同社のGPU調達力は格段に高まった。H100の供給が逼迫する状況下でも数十億ドル規模の調達枠を確保し、MicrosoftやMetaといったハイパースケーラーと並ぶ大口顧客としてNVIDIAの供給計画に組み込まれている。この関係がInfiniBand全面採用というインフラ設計の一貫性に直結している。
AI産業の水平分業を促す供給網の再編
CoreWeaveの設備戦略は、AI計算リソースを自社保有する垂直統合モデルと、専業事業者から調達する水平分業モデルの選択を市場に突きつけている。同社はGPUクラスタを丸ごとサービス化し、顧客企業は物理インフラの設計や運用から解放される。2024年には英BTグループやカナダNexGen CloudがCoreWeaveのインフラを採用し、自前データセンター建設の代替としてGPU専用クラウドを選択する動きが通信業界にも広がった。AI半導体の供給制約が続く限り、GPU調達力と冷却技術の両面で優位に立つ専業事業者への需要集中は続く公算が大きい。
日本市場が直面する液冷対応と電力制約
日本国内でもさくらインターネットが政府のAIクラウド整備事業に採択され、H100約2千基規模のGPU基盤を整備中だ。しかし国内データセンターの多くは空冷設計で、ラックあたりの電力供給は20kW前後が一般的とされる。外資系DC事業者が液冷対応の新設を進める一方、既存施設の改修コストは大きく、次世代GPUの導入障壁になりうる。経済産業省の「AIデータセンター整備促進事業」が補助金を通じて液冷導入を後押しする構図はあるが、電力系統容量の不足が新規立地の制約となっており、GPU専用クラウドの国内供給量は当面限定的との見方が広がっている。
液冷標準化と半導体サイクルの分岐点
液冷技術は従来ハイパフォーマンスコンピューティングの特殊解と見なされてきたが、AI需要がデータセンター設計の主流要件に押し上げた。冷却分野ではVertivやSchneider Electricが液冷ユニットの製品化を急ぎ、NVIDIAも液冷対応ラック「GB200 NVL72」を2025年の量産計画に組み込んでいる。一方で半導体の微細化と消費電力低減が進めば液冷の優位性が縮小するシナリオもあり、インフラ投資の回収期間を見極める局面に入っている。CoreWeaveの設備選択は、GPU性能競争が冷却とネットワークという物理層にまで及んだAI産業の構造転換を象徴している。