AIモデルを動かすための基盤「ggml」の最新ビルド状況が更新された。Apple Siliconの「Kleidi AI」対応が無効化される一方、Androidのarm64 CPU対応が明確に維持されており、モバイル・エッジ推論の主戦場が整理されつつある。クラウドGPUに依存しない「ローカルAI」の現実解として、どのプラットフォームが選ばれているのかが浮き彫りになった。

この記事を一言でいうと

軽量AI推論ライブラリ「ggml」のマルチプラットフォーム対応状況から、Apple SiliconとAndroid arm64がエッジ推論の主要ターゲットとして優先され、一部の特殊アクセラレータ対応は無効化される局面に入っている。

なぜ話題なのか

今回の一次情報は、ggmlが実際にどのOS・アーキテクチャ向けにビルドを通しているかを示すリストだ。ggmlはオープンソースの軽量テンソル演算ライブラリで、llama.cppなど多数のローカル推論ツールの土台になっている。MetaのLlamaシリーズをはじめとする大規模言語モデルを、個人のPCやスマートフォンで動かすときに真っ先に名前があがる重要基盤であるため、どの環境が「生きていて」、どの環境が「無効化(DISABLED)」されているかは、今後のAI推論の主戦場を読む手がかりになる。

一般読者や企業にどう関係するのか

このリストが示すのは、AIを自社サービスに組み込みたい企業や、個人開発者が「どの端末で動かせるか」の現実的な選択肢だ。macOSではApple Siliconが主力で、Intel Macは限定的になる。iOS向けのXCFrameworkも提供されており、iPhone・iPad上でのオフライン推論が技術的に可能であることが確認できる。Androidはarm64 CPU向けにビルドされており、PixelやGalaxyなど多くのスマートフォンでローカルAIが動作する道が開かれている。日本企業にとっては、クラウドにデータを送らずに済むオンデバイスAIを導入する際の技術的な裏付けとなり、プライバシー重視のサービス設計や通信コスト削減の検討材料になる。

AI業界の構造で見ると何が変わるのか

ggmlの対応状況は、推論実行基盤の「分散化」が進んでいることを示している。Linux向けでは、従来のx64 CPUに加えてarm64、s390x(IBM Z)までカバーしており、Vulkanを使ったGPUアクセラレーション、AMDのROCm、IntelのOpenVINO、さらにはSYCL(FP32)まで網羅している。ただしSYCLの一部は無効化されており、すべてのアクセラレータが等しく重視されているわけではない。WindowsではCUDA 12/13用のDLLが提供されており、NVIDIA GPUを使った高速推論の選択肢も明確に残っている。一方で、Windows on ARMやHIPは対応が途切れておらず、x64からarm64への緩やかな重心移動と、マルチベンダーGPU対応の難しさが同時に表れている。

一次情報から確認できる事実

  • macOS Apple Silicon(arm64)向けビルドは有効。ただし「KleidiAI enabled」はDISABLEDと明記されている。
  • macOS Intel(x64)向けビルドは有効。
  • iOS向けはXCFrameworkとして提供。
  • Linuxはx64/arm64/s390xのCPUと、Vulkan、ROCm 7.2、OpenVINOが有効。
  • Linux向けSYCLのFP32対応は無効化。
  • Android arm64(CPU)は有効。
  • Windowsはx64/arm64のCPU、CUDA 12/13、Vulkanが有効。SYCLとHIPは無効化されていない(DISABLED表記なし)。
  • openEuler環境では、910b(ACL Graph)が有効だが、310pは無効化。
  • UIは独立して「UI」として記載。

関連企業・関連技術

  • ggml: 軽量テンソル演算ライブラリ。llama.cppの中核。
  • Apple: Apple Silicon(M1/M2/M3/M4)上でのローカルAI推論をMac・iOSで提供。
  • Arm: Androidスマートフォンの大半を支えるアーキテクチャ。Kleidi AIもArmの技術。
  • NVIDIA: CUDA 12/13を通じたWindowsローカル推論の高速化。
  • AMD: ROCm 7.2を通じたLinux上のGPU推論。
  • Intel: OpenVINO、SYCLを通じた推論アクセラレーション。
  • openEuler: 中国発のOSエコシステム。Ascend 910bなどのAIアクセラレータと連携。
  • Google: Android OSの提供元。オンデバイスAIの主要プラットフォーム。

今後の論点

  • Apple Silicon向けのKleidi AI無効化は一時的なのか、アーキテクチャ上の判断なのか。
  • Android向けにGPUアクセラレーション(Vulkanなど)が追加されるかどうか。
  • Windows on ARMが普及した場合、現在のarm64 CPUビルドがノートPC市場にも波及するか。
  • 無効化されたSYCLや310p対応が再度有効化される条件は何か。
  • サーバー推論とエッジ推論の分業が、ggmlのような軽量基盤の進化でどう変わるか。