OpenAIがライフサイエンス専用モデル「GPT‑Rosalind」の機能拡張を発表した。従来の言語モデルが苦手としてきた創薬やゲノム解析の現場で、実用的な性能を示す評価基準を独自に整備し、研究ワークフローに即した支援を目指す。

この記事を一言でいうと

製薬企業や研究機関の実際の業務フローに合わせた評価指標「LifeSciBench」をOpenAIが設計し、GPT‑Rosalindが医薬品開発の各段階でどの程度役立つかを可視化した。単なるクイズ正答率ではなく、創薬現場の意思決定に直結する能力が問われ始めている。

なぜ話題なのか

これまでの生物学向けAI評価は、特定の分野知識を問う択一問題や、タンパク質の構造予測精度といった単体タスクに限られていた。しかし創薬の現場では、論文や実験記録といった複数ソースのエビデンスを突き合わせ、規制当局とのやり取りを見据えた判断を下す、総合的な作業が求められる。OpenAIが定義した「LifeSciBench」は、エビデンスの取り扱い、分析、設計と最適化、科学的推論、検証と運用、翻訳と伝達という6領域を一貫評価する枠組みで、創薬の実務にモデル性能を近づける試みだ。

一般読者や企業にどう関係するのか

一見すると製薬企業やバイオテック向けの話だが、医療費や新薬開発の長期化といった課題は消費者や保険者にも波及する。たとえば今回の評価例には、遺伝子治療の臨床データをもとにFDAとの面談準備を支援するタスクが含まれている。こうした規制対応の効率化が進めば、有望な治療法が市場に出るまでの時間やコストが圧縮される可能性がある。日本でも希少疾病用医薬品の開発や再生医療分野で、同様の対話型AI支援が研究の加速に寄与するとみられる。

AI業界の構造で見ると何が変わるのか

OpenAIはGPT‑5.5が持つ「エージェント的なコーディング」と「ツール利用」の能力を、創薬領域の専門知識と組み合わせている。これは汎用モデルを業界特化版に仕立てる手法として、クラウド事業者や製薬ITベンダーのサービス設計にも影響を与える。モデル単体の性能競争から、実務ワークフローへの組込みやすさと、それを評価する業界固有ベンチマークの整備へと、競争の軸が移動している。

一次情報から確認できる事実

  • GPT‑RosalindはGPT‑5.5を基盤とし、医薬品化学やゲノム解析などの創薬領域に特化した性能強化が施されている。
  • 新たに「LifeSciBench」を設計し、エビデンス処理、分析、設計最適化、科学的推論、検証と運用、翻訳と伝達の6領域で有効性を評価している。
  • 評価例として、AAV9ベースの遺伝子治療に関するFDA Type B面談準備を想定したタスクが示されている。
  • 本モデルは、信頼されたアクセス体制を通じて、対象となる組織に研究プレビュー版として提供される。
  • 2026年6月3日付で公開された情報であり、商用提供の時期や価格については明示されていない。

関連企業・関連技術

  • OpenAI:基盤モデルGPT‑5.5と業界特化版GPT‑Rosalindを提供。
  • 製薬企業・バイオテック:創薬ターゲット探索、非臨床・臨床試験設計、規制対応の効率化に活用が想定される。
  • 規制当局(FDAなど):面談準備や申請資料の整合性チェックといった間接的影響が考えられる。
  • クラウド事業者・ITベンダー:専門モデルを組み込んだ創薬プラットフォームの展開が加速する可能性がある。

今後の論点

  • LifeSciBenchの詳細な項目や外部専門家による判定基準は公開されておらず、実際の信頼性や再現性の検証が必要。
  • 規制当局とのやり取りをAIが支援することの許容範囲や、説明責任の所在が明確になっていない。
  • モデルの導入が創薬研究のスピードと質にどの程度の差をもたらすか、実際の導入組織からの報告が待たれる。