基盤モデル公式発表 official_blog OpenAI News 原文公開: 2026/06/03 掲載: 2026/06/05

GPT‑Rosalindの新展開、創薬ワークフローを直接支援するAIへ─評価指標も独自設計

なぜ重要か

創薬AIの評価基準が、単純な正答率から実務の意思決定を測る指標へと変わり始めた。汎用モデルを業界特化させる手法が確立すれば、製薬企業だけでなくクラウド事業者やITベンダーのプラットフォーム設計にも波及し、創薬ワークフロー全体の効率化を競う構造に移行する。

OpenAI

#ai-agents

StoryGraphで見る →

Key Points

この記事の要約

創薬支援AIの評価が、クイズ正答率から実務の意思決定を測る指標へと変わり始めた。

汎用モデルを業界特化させる手法が確立し、クラウドやITベンダーの創薬プラットフォーム設計にも影響が及ぶ。

規制対応の効率化が進めば、新薬開発の期間とコストが圧縮され、医療費や患者アクセスにも波及する可能性がある。

掲載日: 2026/06/05 原文公開日: 2026/06/03 一次情報種別: official_blog 一次情報を確認

構造

この記事が示す産業構造

創薬支援AIの評価が、クイズ正答率から実務の意思決定を測る指標へと変わり始めた。

関係企業

クラウド、モデル、供給網上の位置

OpenAI はCompanyページとStoryGraphから、供給元、顧客、競合、技術依存を確認できます。

変化

何が変わるか

汎用モデルを業界特化させる手法が確立し、クラウドやITベンダーの創薬プラットフォーム設計にも影響が及ぶ。

次の論点

次に見るべきポイント

規制対応の効率化が進めば、新薬開発の期間とコストが圧縮され、医療費や患者アクセスにも波及する可能性がある。

#agents #coding-agent #openai #reasoning

OpenAIがライフサイエンス専用モデル「GPT‑Rosalind」の機能拡張を発表した。従来の言語モデルが苦手としてきた創薬やゲノム解析の現場で、実用的な性能を示す評価基準を独自に整備し、研究ワークフローに即した支援を目指す。

この記事を一言でいうと

製薬企業や研究機関の実際の業務フローに合わせた評価指標「LifeSciBench」をOpenAIが設計し、GPT‑Rosalindが医薬品開発の各段階でどの程度役立つかを可視化した。単なるクイズ正答率ではなく、創薬現場の意思決定に直結する能力が問われ始めている。

なぜ話題なのか

これまでの生物学向けAI評価は、特定の分野知識を問う択一問題や、タンパク質の構造予測精度といった単体タスクに限られていた。しかし創薬の現場では、論文や実験記録といった複数ソースのエビデンスを突き合わせ、規制当局とのやり取りを見据えた判断を下す、総合的な作業が求められる。OpenAIが定義した「LifeSciBench」は、エビデンスの取り扱い、分析、設計と最適化、科学的推論、検証と運用、翻訳と伝達という6領域を一貫評価する枠組みで、創薬の実務にモデル性能を近づける試みだ。

一般読者や企業にどう関係するのか

一見すると製薬企業やバイオテック向けの話だが、医療費や新薬開発の長期化といった課題は消費者や保険者にも波及する。たとえば今回の評価例には、遺伝子治療の臨床データをもとにFDAとの面談準備を支援するタスクが含まれている。こうした規制対応の効率化が進めば、有望な治療法が市場に出るまでの時間やコストが圧縮される可能性がある。日本でも希少疾病用医薬品の開発や再生医療分野で、同様の対話型AI支援が研究の加速に寄与するとみられる。

AI業界の構造で見ると何が変わるのか

OpenAIはGPT‑5.5が持つ「エージェント的なコーディング」と「ツール利用」の能力を、創薬領域の専門知識と組み合わせている。これは汎用モデルを業界特化版に仕立てる手法として、クラウド事業者や製薬ITベンダーのサービス設計にも影響を与える。モデル単体の性能競争から、実務ワークフローへの組込みやすさと、それを評価する業界固有ベンチマークの整備へと、競争の軸が移動している。