主要AIモデルの83%がHugging Faceに集約、オープンソース開発の新潮流
2026年春時点で、主要な大規模言語モデル(LLM)の83%がHugging Face上で公開・共有されており、AI研究開発における同プラットフォームの一極集中が加速している。Hugging Faceが発表した年次レポート「State of Open Source on Hugging Face: Spring 2026」によると、登録モデル数は前年比2.4倍の480万件に達し、オープンソースAIの開発スピードと多様性が質的に転換点を迎えたことが明らかになった。
登録モデル480万件、マルチモーダルが牽引役に
レポートの中核を成すのは、モデル登録数の急拡大である。2025年春時点で200万件だった登録数が、わずか1年で480万件へと倍増した。この成長を牽引したのは画像・音声・3Dデータを統合的に扱うマルチモーダルモデルであり、全登録モデルの41%を占めるに至った。
特に音声合成と動画生成の分野では、コミュニティ主導の小規模モデルが商用モデルに迫る性能を示し始めている。Hugging Faceの技術ディレクターであるジュリアン・ショーモン氏は「2025年後半から、1000万パラメータ未満の軽量モデルが特定タスクで70億パラメータ級モデルと同等の精度を達成する事例が急増した」と指摘する。
データセット登録数も34万件を突破し、前年比3.1倍の伸びを記録した。医療画像やゲノム配列といった専門領域のデータセットが充実し、学術機関によるアップロードが全体の58%を占めている。
企業の参入加速、上位貢献者の顔ぶれに変化
2025年に顕著だったのが、大手テクノロジー企業による積極的なモデル公開である。メタは「Llama 4」シリーズを全バリエーションでHugging Faceに投入し、マイクロソフトは「Phi-4」ファミリーの量子化バージョンを段階的にリリースした。さらにグーグルのDeepMind部門も「Gemma 3」の重みを公開し、研究コミュニティとの協調路線を強めている。
企業の参加拡大に伴い、プラットフォーム上位貢献者の構成も変化した。2年前は個人開発者が上位50位の72%を占めていたが、2026年春の調査では企業アカウントが48%にまで上昇している。ショーモン氏は「企業はAIを自社サービスに組み込むだけでなく、業界標準を形成する場としてHugging Faceを戦略的に活用し始めた」と分析する。
収益面では、有料のエンタープライズハブ契約数が前年比3.8倍の1万2000件に達し、年間経常収益(ARR)は4億5000万ドルを突破した。2024年のARRが1億2000万ドルだったことを踏まえると、2年間で3.75倍の急成長を遂げた計算になる。
安全性評価ツールの標準化が進行
オープンソースAIの普及に伴い、モデルの安全性と透明性をどう確保するかが業界全体の課題となっている。Hugging Faceは2025年9月、モデルカードの自動生成と安全性スコアリングを行う「Trust & Safety Hub」を刷新し、バイアス検出や有害性評価のベンチマークを統合した。
アナリスト予測では、2026年末までに同プラットフォーム経由でダウンロードされるモデルの70%以上が、この自動安全性評価を通過したものに限られる見通しである。EUのAI規制法施行を見据え、欧州企業を中心にコンプライアンス対応の需要が急拡大しているためだ。
日本企業の活用進む、国内AI開発の下支えに
日本市場に目を転じると、Hugging Faceの存在感は着実に増している。2026年春時点で日本からのモデル公開数は前年比2.1倍の8万2000件となり、国別ランキングで8位に浮上した。特にサイバーエージェントやPreferred Networksといった国内AI企業が、日本語特化モデルを継続的に公開していることが数字を押し上げている。
経済産業省が2025年12月に発表した「AIオープンイノベーション指針」では、Hugging Faceを含む共有基盤の活用が推奨されており、国立研究開発法人によるデータセット公開も相次いでいる。国内ベンダーの間では、自社開発とコミュニティ版の相互フィードバックが製品開発サイクルを短縮する効果が認識され始めており、AI人材の獲得競争にも影響を与えつつある。
分散型ホスティングと被災リスクへの備え
急成長の裏側で、一極集中がもたらすリスクへの対応も進む。2025年11月に発生した欧州の大規模停電では、Hugging Faceの一部サービスが6時間にわたりアクセス不能となり、研究プロジェクトの中断が相次いだ。この障害を受けて同社は、IPFS(惑星間ファイルシステム)を用いた分散型ホスティングの試験運用を開始している。
コミュニティ主導のミラーサイト構築も活発化しており、2026年4月までに世界37カ所でキャッシュサーバーが稼働を始めた。プラットフォームの耐障害性向上は、オープンソースAIエコシステム全体の安定性に直結する課題として、優先度の高い投資領域に位置づけられている。