Googleの「AMIE」などのAI医療ツールが診断や治療判断で人間の医師と同等またはそれ以上のパフォーマンスを示す – GIGAZINE

2026年06月18日 16時50分
AI


2026年6月17日、Googleが開発したAI医療ツールの「AMIE」とドイツの研究者らが開発したAI医療ツールの「MIRA」が、さまざまな診断および治療判断で人間の医師と同等、あるいはそれ以上のパフォーマンスを示すとの研究結果が発表されました。これらの結果は、専門的な医療分野においてAI医療ツールが臨床的価値の実証段階に近づいていることを示すとのことです。

Towards Conversational AI for Disease Management | Nature
https://www.nature.com/articles/s41586-026-10764-5

Towards autonomous medical artificial intelligence agents | Nature
https://www.nature.com/articles/s41586-026-10675-5

AI medical tools match or surpass doctors for advice
https://www.ft.com/content/734a45ee-86c4-47e1-8323-569bc14dcdd7

チャットAIの性能向上と世界的普及により、すでに多くの人々が日常の症状や健康上の不安についてチャットAIに相談し始めています。一方、実際の臨床現場でもAI医療ツールの導入が検討されており、実際にマンモグラフィーやMRI、病理画像の読影補助でAIを使う動きが広がっています。

そんな中で学術誌のNatureに、ドイツの研究者らが開発したAI医療ツール「MIRA」と、GoogleのAI医療ツールである「AMIE」のパフォーマンスに関する研究論文が発表されました。


MIRAは電子カルテシステムから患者データを取得し、診断検査の依頼や投薬、治療処置の予約などを含む8万5000もの選択肢から最適なものを選ぶツールです。研究では「患者役のAIエージェント」を用意し、500件以上の救急外来の臨床症例の情報を用いてMIRAのテストを行いました。

その結果、MIRAは盲腸(虫垂炎)や肺塞栓症などを含む8つの疾患の診断において、87.1%という高い診断精度を発揮しました。これはさまざまな専門分野の人間の医師6人からなるパネルが達成した78.1%という数値を上回っています。

また、AMIEは患者役を演じる人物から提供されたデータに基づき、患者の治療計画や投薬判断を行うツールです。研究では、イギリスの最新の臨床診療ガイドラインと薬剤推奨事項に基づいた100件の症例シナリオについて、患者役を演じる人物からのデータに基づいて判断を下しました。

AMIEの診断を合計21人の医師と比較したところ、AMIEは患者の管理における推論能力において人間の医師に匹敵し、治療計画は医師よりもガイドラインに正しく沿っていました。また、難しい症例における投薬判断においては、人間の専門家を上回るパフォーマンスを発揮したと報告されています。


なお、研究者らはいずれのAI医療ツールにも限界があることを認めており、MIRAは少数ですが最善の診療方法から逸脱した治療を提案してきたとのこと。また、テストに用いられた症例情報は、実際の救急外来で患者から聴き取る場合よりも構造化されており、臨床現場で起こり得る省略や矛盾が少なかった可能性があります。

AMIEの開発者らは今回の結果は画期的なものだとしつつも、症例構成やテキストベースの患者シナリオは実際の臨床現場を反映したものではないと指摘。診断のパフォーマンスは有望であるものの、潜在的な推論エラーなどの問題を抑制するためにさらなる研究が必要であり、実用化の準備はまだ整っていないと説明しました。

また、シェフィールド大学数理物理科学部のウェイ・シン助教は、汎用(はんよう)AIモデルもベンチマークテストで同様のスコアを出していたことを考えると、AMIEの優位性がどこから来ているのかにも疑問が生じると指摘。「これはAMIEの優位性が、AMIEを取り巻く特定のシステムというよりも、AIモデル全般の急速な進歩を反映している可能性を示唆しています」と述べました。

この記事のタイトルとURLをコピーする