人工知能の助言で敗血症治療成績は向上するか?(Nature Medicine掲載論文)

課題

世界の死亡原因の第3位は敗血症だといわれているにも関わらず、最適な治療法については不確実さが残っています。特に静脈内輸液と昇圧剤の処方に関しては、準最適な方法しか知られておらず、場合によっては害になる場合もありました。
敗血症の患者は毎年3000万人以上の人々が罹患し、600万人が死亡しているとされています(WHOファクトシート)。もし現状の薬や手技であっても、それぞれの患者の状態に最適化された治療方法の種類や量、タイミングの改善により数%でも生存率が向上すれば毎年数万人の患者が助かることになり、ますが医学研究の課題になっています。
敗血症のみならず、人工知能による病気の発見や治療成績の向上は医学界からも注目されていますが、患者を実験台にせずに人工知能の学習を行わなければならないなどの課題を解決しなければなりません。

解決方法

インペリアルカレッジロンドンのコモロフスキ講師らは強化学習を用いた処方方法(患者の状態に応じた静脈内輸液と昇圧剤の量とタイミング)の最適化手法を提案し、Nature Medicineに発表しました。
強化学習による学習では、システムは最初はランダムに振る舞うのですが、設計者が設定した「報酬」を最大化し、罰を最小化するように試行錯誤的に経験から学んでいきます。最近では世界チャンピオンの囲碁棋士を破るなどの成果をあげています。
強化学習は通常、実際にそのシステムが振る舞う場所で学習するのが良いのですが、このケースで通常行われるように最初から現場で治療を試行錯誤してしまうと患者の状態が悪化したり、最悪死亡しなければ何が「悪い」処方なの分からずに学習することはできません。
著者らは、臨床現場で人工知能が無垢な状態から「偽医者」として活動することを回避するために、実際の医療現場における敗血症の治療に関する情報を集めて、擬似的に試行錯誤を行いました。
学習に使われた訓練データは、ある一つの指導病院の5つの集中治療室からの17,083人の入院患者と異なる128病院の集中治療室からの79,073人の入院患者から収集されました。
患者の状態に関する48種類の時系列データ、処方薬の量やタイミング、治療予後のデータを用いて時系列的な治療の意思決定をするようにシステムの強化学習を行いました。

どうなったか

平均して人間の臨床医より高い治療成績となりうることを示しました。
強化学習の訓練用データと無関係なデータを用いて検証した結果、結果的に人工知能と同じ処方量だった患者のグループでもっとも死亡率が低かったと報告しています。
しかし、まだ臨床試験は行なっておらず、今後はこのシステムを使って実際の治療成績が向上するのかを確かめる必要があります。

まとめ

敗血症の原因はしっかりとはわかっておらず、治療法は試行錯誤的な臨床研究により徐々に向上しているようですが、まだ改善の余地があったようです。

強化学習による試行錯誤といっても多くのデータを集めることで擬似的に試行錯誤を行い治療成績が向上できるというのは、システムが未熟な段階での問題を解決できそうです。

このような手法は医療に限らず他の分野での活用できるかもしれません。

 

(森裕紀)