Hカンパニー、高スループットAI「Holotron-12B」発表

Hカンパニーは2026年3月17日、マルチモーダルコンピューター使用エージェント「Holotron-12B」を公開した。同モデルは、従来の静的画像処理ではなく、対話型環境での認識・決定・行動を目的としたポリシーモデルとして設計されている。運用環境におけるスケーラビリティとパフォーマンスを最優先し、Hカンパニーの研究部門間での緊密な連携によって開発された。これは、エージェントワークロードにおける推論効率の課題を解決する新たな試みである。

技術的には、ハイブリッド状態空間モデル（SSM）とアテンションメカニズムを組み合わせたNVIDIA Nemotron-Nano-2 VLを基盤としている。SSMはKVキャッシュのメモリ負荷を削減し、長文脈や多数の画像を含む処理で線形スケーラビリティを実現する。単一H100 GPU上での評価では、同時実行数100において毎秒8,900トークンのスループットを記録。既存のHolo2-8Bと比較し、処理速度が2倍以上向上した。これにより、データ生成やオンライン強化学習など、高並列処理が求められる業務で優位性を発揮する。

現在の多くのマルチモーダルモデルは、指示に従うことや静的な視覚認識に最適化されている。しかし、Holotron-12BはWebVoyagerベンチマークなどで示されるように、実稼働環境での継続的なエージェント動作に特化している。NVIDIAインセプションプログラムの一環として開発され、Hugging Faceでオープンに提供される。推論コストの低下は、AIエージェントの実用化における重要な障壁を取り除く意味を持つ。

日本企業にとっても、この技術は業務自動化の加速に寄与する可能性がある。高スループットなエージェントにより、大量のデジタルタスクを低コストで処理できるようになる。特に、複雑なUI操作や長期的な対話履歴を扱う業務システムにおいて、既存のモデルでは困難だったリアルタイム性の高い処理が可能になる。クラウドインフラの負荷軽減も期待され、AI導入の経済性を高める要因となるだろう。

今後は、さらに大規模なエージェントワークロードでの安定性が検証される。Hカンパニーは、このモデルがデータアノテーションや強化学習の基盤として活用されることを想定している。オープンモデルとして公開されることで、コミュニティからのフィードバックを通じて迅速な改善が期待される。AIエージェントが単なるアシスタントから、自律的に作業を完遂する主体へと進化する過程で、Holotron-12Bは重要なマイルストーンとなる可能性がある。

元記事を読む（Hugging Face）→

Hカンパニー、高スループットAI「Holotron-12B」発表

関連記事

この記事も読まれています