Googleが次世代モデル「Gemini 3.5」を発表した。このリリースの本質は、単なる言語モデルの性能向上ではない。「frontier intelligence with action」という副題が示す通り、推論能力と実世界のタスク実行を統合したAIエージェントの完成度を競う新たな段階に、巨大プラットフォームが本格参入した宣言である。

背景:推論特化とエージェント化の同時進行

2025年に入り、AI産業の開発焦点は明確に二極化している。一つはOpenAIのoシリーズやAnthropicのClaude 4に代表される「深い推論」を売りとするモデル群、もう一つはブラウザ操作やAPI連携によって実際のタスクを完遂する「AIエージェント」の実用化だ。

GoogleのGemini 3.5は、この二つを単一のモデル系列で両立させる戦略を取った。同社の発表資料によると、Gemini 3.5は大規模マルチモーダル推論ベンチマークMMMUにおいて従来比で約15%のスコア向上を達成しつつ、ツール呼び出しとマルチターンの自律実行能力を標準搭載する。

これまでは、推論に強いモデルとアクションに強いモデルをオーケストレーション層で組み合わせる設計が主流だった。モデル自体に両方の能力を持たせることで、応答速度の改善と障害点の削減を狙ったのが今回の設計思想である。

構造:クラウド基盤とAPI経済圏の再編

この発表を深読みするには、AI供給網におけるGoogleの特異な立ち位置を理解する必要がある。同社は自社設計のTPUチップ、大規模クラウド基盤Google Cloud、そして検索・メール・地図等の実サービスから生成される訓練データを垂直統合している。競合他社がNVIDIAのGPU調達に数十億ドル規模の資本投下を強いられるなか、GoogleはTPU v6への移行によって推論コストの低減と供給制約からの独立性を同時に追求できる。

API提供の面でも変化は顕著だ。Gemini 3.5はGoogle AI StudioとVertex AIを通じて即日提供が開始されたが、料率体系は従来のトークン課金に加え、タスク完了単位の従量課金が試験導入されている。これはAPI経済が「生成」から「実行」へ重心を移しつつある証左である。AIが自律的に複数ステップの操作を行う世界では、入出力トークン量より成果物の価値に課金するモデルへ移行する必然性が生じる。

さらに、モデル競争の構図も変わる。MetaのLlama 4やMistralのオープンモデルが推論市場で価格破壊を進める一方、Googleは検索と広告という巨大収益源を背景に、最先端モデルをエコシステム内で囲い込む戦略を維持している。Gemini 3.5のエージェント機能は、Google WorkspaceやAndroid端末との深い結合を前提としており、単体のAPI性能では測れない競争優位を設計している。

影響:バーティカルAIと日本市場への波及

エージェント化は企業向けAI導入の設計を根本から変える。従来のRAGやチャットボットは、ユーザーの明確な指示が起点だった。Gemini 3.5が目指すのは、ユーザーが曖昧な目標を与えるだけで、情報収集から外部サービスとの連携、成果物の形式変換までをモデルが判断して完遂する体験である。

この変化は、金融機関のリサーチ自動化、製造業のサプライチェーン最適化、法務の契約書レビューなど、複数システムを横断するホワイトカラー業務に直接影響を与える。アクセンチュアの2025年予測では、エージェント型AIの企業導入率は年内に全体の18%に達する見込みであり、この数字を押し上げる起爆剤になりうる。

日本市場にとって注目すべきは、Google Cloudの東京リージョンにおけるGemini 3.5提供の有無だ。金融や医療など、データ主権の観点から国内リージョンでの処理を求める業界では、提供可否が導入判断を左右する。また、ソフトバンクやNTTデータなど国内Slerは、自社のエージェント開発フレームワークにGemini 3.5を組み込むか、あるいは国産LLMとの差別化を図るかの戦略選択を迫られることになる。

今後の論点:モデル評価軸とセキュリティ

エージェント型モデルの登場は、性能評価の軸そのものを再定義する。従来のMMLUやHumanEvalのような静的ベンチマークでは、実環境でのタスク成功率や副作用リスクを捕捉できない。WebVoyagerやOSWorld等のエージェント特化型ベンチマークが提案されているが、業界標準には至っていない。

加えて、自律的なアクション実行はセキュリティと責任所在の問題を深刻化させる。GoogleはGemini 3.5に段階的な権限承認機能と実行ログの完全監査を組み込んだとしているが、金融取引や医療行為など、誤作動が不可逆的な損害を生む領域での採用には依然として高い障壁が存在する。

規制面では、EU AI Actの高リスク分類に該当するユースケースへの適用可否が、年後半の法的整理を待つ状況だ。モデル自体の性能競争は一巡しつつあり、2026年に向けた競争の主戦場はガバナンスと信頼性の実装に移るだろう。