病理医と人工知能の協力で乳がんの微小転移を見逃さない:Googleと米国海軍医療センターの共同研究による乳がん診断人工知能「LYNA」
課題
医療機器や診断技術の進歩により様々な病が発見、治療可能になってきています。近年では人工知能技術を利用した医用画像等診断システムが登場し、悪性腫瘍である「がん」に対しても発見の早期化が期待されています。しかし、がんは一部の場所にとどまらず循環器系やリンパ系を介して別の場所に転移する特性を持っており、このような転移性のがんは検出が非常に困難であることが知られています。女性に多い乳がんもその多くがリンパ節へ転移することが知られています。この転移性のがんは発見が難しく、限られた時間の中では優れた病理医による検査でも約38%の微小転移しか発見することができません。このため乳がん患者の死亡原因の90%はがん転移によるものであり、早期に微小な転移性のがんを発見することは死亡率を改善する重要な課題となっています。
このような課題に対して、GoogleのAI開発部門と米国海軍医療センターは生体組織画像から乳がんの微小転移を発見する人工知能システムである「LYNA:LYmph Node Assistant(リンパ節アシスタント)」を開発しました。
解決方法
LYNAは顕微鏡によって撮影された生体組織画像から畳み込みニューラルネットワーク(CNN)を用いることによって乳がんの微小転移を検出します。LYNAの開発チームではGoogleが公開しているInception-V3と呼ばれる一般物体認識用モデルを利用しています。このInception-V3は大量の一般物体データ(例えば動物や車など)を学習した学習済みモデルが公開されています。
LYNAの学習では、100,000 × 100,000ピクセルサイズの非常に巨大な生体組織画像から299 × 299ピクセルの微小領域(パッチ)を学習データとして複数切り出し、その中心部である128 × 128ピクセル(約32μm四方)の領域に対して生体組織が転移性のがんかそうでないかの診断情報を、学習済みのInception-V3に教師あり学習として学習させました。また生体組織画像を学習させる際に、異なる2つのデータセットを利用し、学習画像の色情報を正規化することによって、様々な生体組織画像に対する識別性能の向上を図りました。学習に用いられた生体組織画像は、良性の組織画像が160枚で悪性(がん)の組織画像が110枚ほどですが、パッチの切り出しにより10万倍ほどの枚数に水増しされています。また良性組織とがん組織画像の比が4:1になるデータセットを構築することでより識別率が向上したようです。学習モデルの詳細に関してはこちらの文献を参考にしてください
どうなったか
未学習のリンパ節への微小転移がん画像をLYNAで識別したところ、生体組織画像に対する診断正答率は99%を示しました。また腫瘍に対する診断感度は91%になりました。この診断精度は異なる生体組織画像データセットでも発揮されており、微小転移がん識別に対するLYNAの頑健性が示されました。
また乳がんのリンパ節への微小転移を診断する病理医を対象に、LYNAを診断に用いた場合とそうでない場合の診断に対する正答率を比較する実験を行いました。病理医がLYNAを利用する場合には、LYNAががん組織であると判定した領域が強調表示されます。実験の結果、病理医がLYNAを用いた場合に微小転移性のがんを発見する感度が優位に上昇することが分かりました。1枚の生体組織画像の診断に要する時間も、LYNAを利用することで半分になることが示されました。また実験では、病理医のみの診断やLYNAのみの診断よりも、病理医がLYNAを利用して診断した場合に最も識別率が高かったことから、人と人工知能システムが協力することによってより効果的に転移性のがんを発見できる可能性が示唆されました。
まとめ
乳がんのリンパ節への微小性転移がんを診断する人工知能システム「LYNA」について紹介しました。近年、様々な病気に対して人工知能システムと医用画像を用いた診断システムが提案・開発されています(例えばこちらやこちら)。今回紹介したLYNAは、一般物体認識に利用されるInception-V3をベースに生体組織画像を追加学習させることで高い識別性能を示しています。このような手法は転移学習と呼ばれ、以前紹介したこちらの手法と関連しています。今後はLYNAのように、汎用的な人工知能モデルを改良することでより専門的な課題を解決するモデルが医用画像識別の分野で活躍するかもしれません。
またLYNAは人間と協力することで自身よりも高い識別性能を発揮しました。この結果は医療診断支援システムの導入を後押しするものと考えられます。