NVIDIA供給網に異変 AMDが推論市場でMI300X急伸の理由

この記事の要約

推論ワークロードの拡大が、NVIDIA一強だったAIチップ供給網に構造的な多極化を促し始めている。

ハイパースケーラーが調達リスク回避とコスト削減のため、AMDのMI300Xを第2の供給源として本格採用に舵を切った。

この動きは、AI投資の重心が学習から推論へ移り、クラウド価格体系にも波及する転換点であることを示唆する。

AIチップ市場の勢力図が推論領域で揺らいでいる。AMDは2025年第1四半期のデータセンター売上高が前年同期比68%増の約38億ドルに達したと発表し、その過半をMI300Xシリーズが占めた。この数字が示唆するのは、学習用GPUで9割超のシェアを持つNVIDIAの牙城に、推論特化型の対抗馬が本格的に食い込み始めたという構造変化の胎動である。

なぜAMDの決算がAI業界全体の信号なのか

半導体企業の決算は、AIインフラ投資の先行指標として機能する。データセンター向けGPUの出荷先と数量は、半年から1年先のクラウド供給力とモデル開発の重心移動を映すからだ。AMDのMI300シリーズが2024年第4四半期に続き好調を維持した事実は、大口顧客であるMetaやMicrosoft、Oracleといったハイパースケーラーが推論ワークロード向けに第2ソースの確保へ本格的に舵を切った証左といえる。

Lisa Su最高経営責任者は決算説明会で「MI300Xは四半期として初めて売上の過半数を超えた」と述べた。同チップは192GBのHBM3メモリを搭載し、大規模言語モデルの推論時にボトルネックとなるメモリ帯域幅でNVIDIA H100のHBM3 80GB構成を上回る。推論タスクでは1チップあたりのバッチ処理能力と消費電力あたりのトークン生成効率が重視されるため、このメモリ優位性が選定理由になったと考えられる。

学習から推論へ移る投資重心と供給網

AIワークロードの支出構造は変曲点にある。2023年から2024年前半にかけて、資本支出の大半はGPT-4やLlamaシリーズといった基盤モデルの学習に振り向けられた。NVIDIAのH100が1基あたり3万ドルから4万ドルで取引され、TSMCのCoWoS先端パッケージング生産枠のほとんどをNVIDIAが押さえる構図が続いた。

推論需要が立ち上がると状況が変わる。エンドユーザーからのAPI呼び出し回数が毎月指数関数的に伸びる環境では、学習済みモデルを走らせるGPUクラスタの総数と地理的分散が収益に直結する。ハイパースケーラーは自社クラウドサービスの差別化要因として「推論あたりのインフラコスト低減」を掲げざるを得ず、単一ベンダー依存は調達リスクとして経営課題化した。

AMDはこの間隙を突いた。MI300シリーズの開発にあたり、NVIDIAが牛耳るCUDAソフトウェア互換レイヤーの壁を越えるため、ROCmオープンソフトウェアスタックのPyTorch統合に注力。Hugging Faceの人気モデル約50万件のうち9割以上がROCm上でそのまま動作する互換性を実現したと発表しており、開発者の移行コストは昨年から大幅に低減している。

価格破壊とクラウド価格体系への連鎖

半導体調査会社SemiAnalysisの推計によると、MI300Xの公称小売価格はH100比で約15%から20%低く設定されている。自社クラウド上でMI300Xインスタンスを展開するMicrosoft AzureとOracle Cloud Infrastructureは、1時間あたりの推論コストで競合比25%減を打ち出した。クラウドのエンドユーザー価格にまで値下げが転嫁される動きは、OpenAIやAnthropicといったフロンティアモデルプロバイダーのAPI課金体系にも波及する可能性がある。

NVIDIAはこの圧力に備え、2025年後半にBlackwell世代の推理専用構成を投入すると予告したが、TSMCの3nmプロセス移行とパッケージング歩留まりが制約条件となる。対してAMDはMI350シリーズを2025年半ばに前倒し投入する計画であり、台湾のサプライチェーン筋によればTSMCのSoIC 3D積層パッケージを採用したチップレット設計で供給リードタイムの短縮を図っているという。

日本企業への調達選択肢と競争環境の変化

日本市場にとっても、GPU調達先の複線化はクリティカルな意味を持つ。経済産業省が主導する生成AI開発基盤整備事業では、さくらインターネットとGMOインターネットグループがNVIDIA GPUを中心とした計算資源の増強を進めてきたが、MI300X対応インスタンスをOracle Cloudの東京リージョン経由で利用する選択肢が現実味を帯びている。NEDOのポスト5G基金で整備されるAIクラウド環境にもAMD製チップの採用検討が入り始めたとの観測があり、国産LLMの推論コスト低減とAPIサービス競争力に寄与する公算が大きい。

カスタムシリコン台頭が迫る構造転換

GoogleのTPUv5、AmazonのTrainium2、MicrosoftのMaia 100という自社開発AIチップの流れも加速している。Google CloudはTPUv5を外部顧客に開放し、AmazonはAnthropicに対しTrainium2上での次世代モデル学習契約を結んだ。これらのカスタムシリコンはNVIDIAやAMDから購入する汎用GPUよりボード単位の消費電力効率で30%から40%上回るケースがあり、規模の経済が働くハイパースケーラーにとっては外販GPU調達費そのものを圧縮する手段となる。

NVIDIAの2025年度GPU売上高が500億ドルを超えるとアナリスト予測は示す一方で、サプライチェーン上流のTSMC先端工程割当と、下流のクラウド事業者による内製チップシフトという二重の客筋変化が長期シナリオの不確実性を高めている。AMDの推論市場での急伸は、こうした多層的な競争軸が可視化された一事例であり、AI半導体の競争が単一企業の独占物語ではなくなったことを示す決算であった。