何が起きたか

OpenAIはChatGPTの医療領域での回答品質を更新するため、GPT-5.5 Instantを投入しました。HealthBenchおよびHealthBench Professionalといった医療系ベンチマークで、より高価な「Thinking」系モデルに匹敵する成績を、低コストで叩き出したとされます。指示追従の評価では最大89.9%に達し、5つの評価カテゴリすべてでGPT-4oと医師が書いた回答を上回ったと説明しています。改善はOpenAIが組織した60か国・260人超の医師ネットワークが70万件超の回答をレビューする体制で進められました。

なぜ重要か

注目すべきは、これが「Pro契約者だけの実験」ではなく無料ユーザーにも開放されている点です。週2億3000万人がすでに健康関連の質問—検査結果の読み解き、受診前の準備、保険手続きの整理—をChatGPTに投げている現実があり、その層がそのまま「医師より高評価のAI」に接続されます。誤回答率が2か月で71%減という変化スピードは、医療AIの臨床ガイドラインや規制議論より明らかに速く、社会実装が制度設計を追い越し始めた局面と言えます。

論点:B2C医療AIが既定路線になる

OpenAIは別途、医療従事者向けのChatGPT for CliniciansやOpenAI for Healthcareも提供しており、C向け(一般患者)とB向け(医療機関)の両面で囲い込みを進めています。日本の医療・ヘルスケア事業者から見れば、患者の「最初の相談相手」がすでにChatGPTに置き換わっていることを前提に動線を引き直す必要があります。

💼 事業会社視点:これは自社にどう効くか

日本のヘルスケア・保険・調剤・健診事業の経営者にとって、これは「AIに代替される未来の話」ではなく、すでに患者の入口が奪われている話です。週2億3000万人が健康相談にChatGPTを使っている時点で、自社サイトのFAQや問い合わせフォームは「二番手の情報源」に格下げされたと考えるべきです。

打ち手は3つに分かれます。第一に、製薬・保険・健診の事業者は自社の検査値解説・約款解説をChatGPTで読み込ませた際に「正しく案内される構造化データ」になっているか、いますぐ点検する必要があります。第二に、オンライン診療・調剤チェーンは「ChatGPTで自己判断→受診」の動線を前提に、予約UIと連携API(カスタムGPT等)への接続を検討すべきです。第三に、医療系SaaS・受託開発は、医師向けのChatGPT for Cliniciansが先行する以上、独自LLM開発より「OpenAI基盤+電子カルテ連携・監査ログ」の上で勝負する設計に転換する局面です。誤回答が2か月で71%減るスピード感の前では、自社モデル開発の投資判断は3か月単位で見直す必要があります。

関連リンク