米国国立標準技術研究所に拠点を置くAI標準・革新センターが、DeepSeekの主要モデルに対して実施した安全性評価の結果を公表した。この評価は単なる技術検証ではなく、サプライチェーン全体における中国発AIモデルのリスク管理手法と、欧米基準との構造的な乖離を浮き彫りにするものである。トランプ政権下で復活した対中技術規制の流れを汲むバイデン政権の輸出管理政策と、AI安全性評価の国際標準化を巡る主導権争いが交錯する局面として重要だ。

背景

今回のCAISIによる評価は、NISTが2023年10月に発表したAIリスクマネジメントフレームワークの実装段階として実施された。特筆すべきは、評価対象が中国の民間企業ながら、その訓練には米国製GPUが使用されている点である。DeepSeekは2023年後半、NVIDIA H800チップを大量調達したことが複数のサプライチェーン調査で確認されている。このH800は、米商務省の輸出規制に対応するために性能を制限した中国市場向け特注品である。つまり、規制の網をかいくぐるかたちで調達された計算資源上で訓練されたモデルに対し、今度は米国の機関が安全性を評価するという、規制と技術検証の循環構造が生じている。AI産業の地政学的分断が、モデル評価という技術的営為にまで及んでいることを示す事例である。

構造

評価プロセスから読み解ける産業構造は三層に整理できる。最下層は計算基盤レイヤーで、NVIDIAのGPUとTSMCの製造プロセスに依存している。このレイヤーでは、米国の輸出規制が物理的な供給制限として機能する。中間層はモデル開発レイヤーで、DeepSeekはオープンソースモデルを積極的に公開しながら、独自のMoE(Mixture of Experts)アーキテクチャを採用し、推論コストの低減を実現している。CAISIの評価はこの中間層における安全性アライメントの欠陥を指摘した。最上層はAPI提供とアプリケーション展開レイヤーで、DeepSeekのチャットボットは中国国内向けと海外向けで異なるコンテンツフィルタリングを実装している。

この三層構造において、CAISIの評価が焦点を当てたのは中間層のモデルレベルである。具体的には、有害なバイアスや悪用可能性、プライバシー保護の不備が検出された。しかし、評価が真に透かし見せるのは、基盤レイヤーにおけるGPU依存の実態である。DeepSeekがH800を使用している事実は、規制当局による安全性評価と、同じく規制当局が科している輸出制限の対象製品が、同一の技術スタック上に存在するという矛盾を可視化する。

影響

この評価結果は、AI安全性の国際標準を巡る競争に三つの波及効果をもたらす。第一に、EUのAI Actにおける高リスク分類の判断材料として参照される可能性がある。CAISIの評価手法はNISTのフレームワークに準拠しており、EUの整合性基準との相互運用性が意識されている。中国発モデルが欧州市場に参入する際の障壁は、技術性能ではなく安全性認証にシフトしつつある。

第二に、クラウド事業者の責任範囲が再定義される契機となる。DeepSeekのモデルはAmazon BedrockやMicrosoft Azure AI Studioを通じて間接的に提供されており、評価で指摘されたリスクがこれらのプラットフォーム上で再現される場合、最終的な責任の所在が問題となる。NISTの評価はモデル開発者を直接対象としているが、AIの供給網全体でみれば、モデルからアプリケーションまでの各段階で安全弁をどう配置するかという構造設計の問題に発展する。

第三に、日本市場への直接的な影響として、国内企業のAI調達判断における評価基準の再考が挙げられる。経済産業省が推進するAIセーフティ・インスティテュート構想は、このCAISIの評価手法を参照する見通しであり、日本企業が中国発モデルを活用する際のデューデリジェンス項目が具体化する。すでに複数の国内SIerがDeepSeekモデルをPoC段階で検証しており、この評価結果は採用判断の遅延または条件付き承認への傾斜をもたらす。

今後の論点

NISTによる評価の継続性と範囲拡大が最大の焦点である。CAISIは今回の結果を初期的な所見と位置づけており、継続的な再評価の枠組みを公表している。アナリスト予測では、2025年までに主要な中国発モデルの8割がNIST基準での評価対象になるとの見方がある。

さらに、モデル評価そのものが地政学的なツールとして機能し始めている点は看過できない。輸出規制で物理的な半導体供給を制限する一方、出来上がったモデルの安全性に難癖をつけるという二段構えの戦略は、AI技術の覇権争いにおける新たな局面である。DeepSeekがオープンソース戦略でコミュニティの信頼を獲得するほど、この規制と評価の循環は複雑化する。

最後に、評価基準の透明性と一貫性の確保が、AI産業全体の信頼構築において決定的に重要となる。特定企業や特定国を標的にした恣意的な評価と受け取られれば、国際標準化のプロセス自体が空洞化するリスクをはらむ。CAISIには、公平性と再現性を担保した評価手法の継続的な公開が求められる。