大規模言語モデル(LLM)を動かすための軽量推論ライブラリ「llama.cpp」を構成する「ggml」ライブラリにおいて、将来のIBMプロセッサ「POWER11」への対応準備が進んでいる。現在の主要コンパイラがPOWER11を正式サポートしていない状況を踏まえ、コンパイラが対応した時点で自動的に有効化する仕組みが導入された。これにより、POWER11搭載システムの登場と同時に、オープンソースAIソフトウェアが稼働できる土台が整う。
この記事を一言でいうと
オープンソースAI推論ライブラリが、まだコンパイラが対応していない将来のIBM製プロセッサ「POWER11」向け機能を、コンパイラ側の準備が整い次第すぐに使えるよう段取りを整えた更新である。
なぜ話題なのか
この更新の主眼は、ビルドエラーの防止と将来互換性の確保という、ソフトウェア基盤における現実的な課題解決にある。POWER11向けのコードを無条件で有効にしてしまうと、POWER11を理解しない現行のGCCやClangでコンパイルした際にエラーが発生し、ソフトウェア全体のビルドが失敗してしまう。そこで、コンパイラが「-mcpu=power11」というフラグを認識するかどうかを事前に確認し、対応している場合にのみPOWER11向けバックエンドを組み込む条件分岐が追加された。
また、POWER10とPOWER11の命令セット上の連続性を踏まえ、POWER11向けコードのコンパイル時に「-mcpu=power10」を指定する実装上の工夫も盛り込まれている。これは、AI推論ライブラリの供給側が、IBMのエンタープライズ向けプロセッサロードマップを現実的なソフトウェア対応計画に落とし込んでいる動きとして注目される。
一般読者や企業にどう関係するのか
この更新自体は開発者向けの基盤整備だが、長期的にはPOWER11を採用する企業システムやクラウドインフラでのAI推論コストと移植性に関係してくる。IBM POWER系プロセッサを導入している金融機関や製造業の基幹システムでは、今回のような事前対応により、ハードウェア刷新時にオープンソースAI基盤を迅速に導入できる可能性が高まる。日本市場では、IBM Power Systemsを基幹系サーバーとして利用する大手企業や金融機関において、将来的なAIワークロードの内製化やエッジ推論への応用を見据えた検討材料となる。
POWER11自体はまだ正式発表されておらず、対応するGCC/Clangもリリースされていないが、この段階でのソフトウェア側の事前対応は、ハードウェア刷新時にオープンソースAI基盤を迅速に導入できる可能性を開く。
AI業界の構造で見ると何が変わるのか
今回の更新は、AI推論の実行環境がx86やArmだけでなく、IBM POWERアーキテクチャまで含めた多様化の布石となる。ggmlライブラリはすでに、macOS Apple SiliconやLinux/Windows上のx64・arm64、Vulkan、CUDA、ROCm、OpenVINO、SYCL、HIPといった多様なバックエンドに対応しており、今回の更新でPOWER11がその一覧に将来加わる準備が整ったことになる。
特定のGPUベンダーやクラウドプロバイダーに依存しないAI推論基盤を志向する企業にとって、IBM POWER系サーバーがAI推論の選択肢として機能しうることは、調達戦略やシステム設計の自由度を高める要素となる。とりわけ、RHELやUbuntuなどLinuxディストリビューションがPOWERアーキテクチャをサポートし続けていることと相まって、オープンソースAIソフトウェアのマルチアーキテクチャ対応は、特定プロセッサアーキテクチャへのベンダーロックインを避ける手段としての意味を持つ。
一次情報から確認できる事実
一次情報から確認できる事実は以下の3点である。第一に、ggml-cpuライブラリのPOWER11バックエンドが、コンパイラの「-mcpu=power11」フラグサポートを条件として有効化される仕組みが導入された。第二に、POWER10とPOWER11向けのコンパイルオプションとして「-mcpu=power10」が使用されている。第三に、この変更はCMakeLists.txtの修正というビルドシステムレベルで対応されており、ggmlプロジェクト全体のビルド構成に統合されている。現時点でPOWER11プロセッサそのものに関する新情報や、IBMからの公式発表は含まれていない。
関連企業・関連技術
IBM:POWER11プロセッサの開発元であり、エンタープライズサーバー市場における主要プレイヤー。POWER10は2021年より提供されており、POWER11はその後継として期待されている。
GCC/Clangコミュニティ:POWER11対応のコンパイラ機能を提供する側。今回のggml側の対応は、これらのコンパイラがPOWER11を認識できるようになることを前提としている。
ggml/llama.cppプロジェクト:今回の更新の主体。オープンソースのAI推論ライブラリとして、多様なハードウェアバックエンドをサポートし続けている。
今後の論点
POWER11プロセッサの正式発表時期と、GCCおよびClangのPOWER11対応状況が、実際のAI推論ワークロードでのPOWER11利用開始を左右する。また、POWER11環境で実行されるAI推論の性能特性(レイテンシやスループット、電力効率)が明らかになるにつれて、特定のAI推論ワークロードにおいてPOWER11がx86やArmに対してどのような位置づけを占めるのか、実証データに基づく評価が必要となる。さらに、金融や製造業などIBM POWER系システムの既存ユーザー企業が、POWER11環境でのAIワークロード検証をどのタイミングで開始するかも、実用化に向けた焦点となる。