AI制御の計画アルゴリズム革新
カリフォルニア大学バークレー校の人工知能研究センター(BAIR)は、大規模な学習済み世界モデルを用いた長期的な計画立案を可能にする新しい勾配ベースのプランナー「GRASP」を開発した。近年、大規模な世界モデルは高次元の視覚空間における未来の観察結果を長期間にわたって予測し、異なるタスク間で一般化できる能力を備えつつある。しかし、強力な予測モデルが存在するからといって、それを実際の制御や計画に効果的に活用できるわけではない。従来の手法では、長期計画において最適化が病态(ill-conditioned)になったり、非貪欲な構造が悪質な局所極小値を生み出したりする問題があった。さらに、高次元の潜在空間は微細な失敗モードを導入し、計画の脆さを増幅させていた。
GRASPはこの課題に対し、3つの核心的な技術革新をもたらした。第一に、軌道を仮想状態に_lift_(持ち上げる)ことで、時間軸に沿った最適化を並列処理可能にし、計算効率を飛躍的に向上させた。第二に、状態反復自体に確率性(stochasticity)を直接付与することで、探索の質を高め、局所最適解への陥没を防ぐ仕組みを導入した。第三に、勾配を再形成し、高次元の視覚モデルを通じた脆い「状態入力」勾配を回避しつつ、アクションに対して明確な信号を与える設計を採用した。これにより、複雑な環境下でも堅牢な計画立案が実現可能となる。
本プロジェクトは、マイク・ラバット、アディティ・クリシュナプリヤン、ヤン・ルカン、アミール・バーとの共同研究として進められた。ルカンのようなAI界の重鎮らが関与している点も注目すべきだろう。大規模言語モデルと同様、世界モデルのスケールアップは単なる予測精度の向上ではなく、汎用的なシミュレーターとしての役割を強めている。GRASPの登場は、AIが単に「未来を予測する」段階から、「予測に基づいて確実な行動を計画する」段階へと移行する重要な分岐点となる可能性がある。特にロボット操作や自律走行など、長期的な意思決定が不可欠な分野において、その実用化は期待される。高次元の視覚情報から直接制御信号を導き出す難しさを克服したこの手法は、AI制御の新たな標準となり得る。研究チームは、このアルゴリズムが現代の世界モデルの限界を押し広げ、より実世界に近い複雑なタスクにおける自律的な行動計画を可能にすると主張している。今後の実証実験と広範な適用事例が、その真価を決定づけることになるだろう。