AIが生成した偽X線写真、放射線科医の59%が見破れず——GPT-5・Gemini 2.5 Proも85%止まり、医療画像の信頼基盤が崩れ始める

2026年3月30日 2026年3月30日

susumoooon

総合スコア

インパクト

新規性

未注目度

衝撃度

証拠強度

実現性

カテゴリー：AI

情報源：https://www.statnews.com/2026/03/24/radiologists-cant-detect-deepfake-xrays/

収集日：2026-03-29

スコア：インパクト18 / 新規性17 / 注目度8 / 衝撃度18 / 根拠10 / 実現性10 = 81点

変化の核心：医療診断の根幹を担うX線画像がAIによって完全な偽物に変えられ、その偽物を人間も機械も区別できない時代が始まった。医療画像の完全性を保証する新しいインフラの緊急整備が求められる。

概要

マウントサイナイ病院の研究者らが査読誌Radiologyに発表した研究によると、ChatGPTが生成した偽造X線写真を放射線科医の約59%が正規画像と誤判定した。GPT-4o、GPT-5、Gemini 2.5 Pro、Llama 4 Maverickの4モデルも57〜85%の精度にとどまり、AIが作った偽物を自らが最も多く検出できたがそれでも完全ではなかった。放射線科医の経験年数と検出精度に相関はなく、筋骨格系専門医のみが有意に高い精度を示した。医療画像の偽造が「専門家も最新AIも欺けるレベル」に達したことが初めて体系的に実証された。

何が新しいか

従来は「AIが生成した画像はAIが検出できる」という仮定が医療界で暗黙の前提とされていた。しかし今回の研究では、GPT-5やGemini 2.5 Proなど最先端のAIモデルでも偽造X線の検出精度が最高85%に留まることが体系的に証明された。さらに放射線科医の専門性・経験年数に無関係に約59%が誤判定したことで、人間とAI双方の検出能力の限界が同時に明らかになった。医療画像の偽造技術が、あらゆる防御線を突破できる段階に到達した。

なぜまだ注目されていないか

医療AI偽造の問題は「将来の懸念」として語られることが多く、「現時点での実被害」として広く認識されていない。放射線科医の誤判定率59%という数字は衝撃的だが、公になった実際の被害事例がないため社会的な危機感は低い。医療画像の認証・検証インフラ整備は規制当局の優先課題になっておらず、国際的な標準化論議も始まったばかりだ。また医療業界は保守的であり、新たな技術リスクへの対応が後手に回りやすい構造がある。

実現性の根拠

査読誌Radiologyに掲載された実験は現実の臨床環境を模した厳密な条件下で行われており、再現性が高い。使用したAIモデル（GPT-4o、GPT-5、Gemini 2.5 Pro、Llama 4 Maverick）はいずれも一般公開されており、悪用のハードルは技術的に低い。医療画像の完全性検証技術（ブロックチェーンベースの認証、デジタル署名埋め込みなど）はすでに技術的に存在しており、実装を急ぐだけの状態だ。欧米の規制当局はすでにAI医療機器のリスク評価枠組み改定を議論し始めている。

構造分析

この問題は単なる技術的課題を超えた制度的・法的リスクを孕む。偽造医療画像が保険請求詐欺、医療訴訟、診断操作に利用される可能性は現実的であり、医療システム全体の信頼性を脅かす。医療画像管理システム（PACS）、電子カルテ（EHR）、病院情報システムの全層に渡る認証インフラの再設計が必要となる。規制当局（FDA、EMA等）は医療機器としてのAI生成画像のリスク分類を早急に見直さなければならない局面に直面している。

トレンド化シナリオ

今後1〜2年以内に、医療画像の真正性を保証するブロックチェーンまたは暗号署名ベースのシステムの国際標準化論議が本格化すると予測される。放射線科学会（ACR、RSNA等）が偽造画像検出ガイドラインを策定し、AI補助の真正性検証ツールが臨床現場に導入され始めるだろう。2027〜2028年頃には医療画像の「出所証明（provenance）」が診断プロセスの必須要件になる可能性があり、医療画像機器メーカー・クラウドプロバイダーにとっての新規市場を生む。