少量の学習用画像データから皮膚腫瘍を判定するシステムを筑波大学と京セラコミュニケーションが共同開発

課題

皮膚疾患の診断は、医師の視診により行うことが一般的です。皮膚腫瘍を考える場合、見た目から判断しにくいケースも多く、画像を撮影した場合でも照明条件や角度がバラバラであり、特殊な拡大鏡(ダーモスコープ)で撮影した画像に比べ、判定が難しいといわれます。さらには、皮膚疾患は希少な疾患が多く、大量の学習画像が必要となるディープラーニングの手法(通常1分類につき各1,000枚以上)には不向でした。
この問題に対して筑波大学と京セラコミュニケーション株式会社の共同グループは、通常より一桁少ない画像枚数でも高い精度で皮膚腫瘍を判定可能な人工知能技術を開発しました。

解決方法

上記の課題を解決するために、研究グループが行ったことは、一般物体認識のためにあらかじめ学習されたGoogLeNetを活用すること、学習データの質を向上すること、学習データの「拡張」をすることです。

まず、識別モデルは120万枚の一般的な画像データによって学習されたGoogLeNetをベースにし、画像特徴量の学習のため自分たちで収集するデータの数を削減しました。

学習データの質を向上させた点としては、臨床写真の中で病理検査を行い診断が確定したものを中心に収集し、間違った写真が含まれていないかを確認して、診断違いの写真を除外しました。その結果、14種類の皮膚腫瘍に対する約6,000枚のデータセットを得ました。また学習データは腫瘍の位置が中心になるようにトリミングを行い、1,000×1,000の画像にリサイズしました。

学習データの拡張として、画像を15度ずつ回転させることで一枚の画像から24枚の画像を作成したり、学習時に画像をぼかしたり明るさを±10パーセントの範囲で変更することで、撮影条件による識別性能の低下を防ぎました。

どうなったか

皮膚悪性腫瘍の陽性を正しく判定する割合である判定感度は96.5%、陰性を正しく判定する割合である特異度は89.5%という結果を得ました。

この結果の有用性を示すために、日本皮膚科学会認定皮膚科専門医13名と比較しました。その結果、皮膚科専門医の良悪性の識別率が85.3%±3.7%に対して、提案したシステムでの良悪性の識別率は92.4%±2.1%となり統計的に有意に高い結果となりました。

また、2種類の識別である良悪性の識別よりも難しい14種類の診断の正答率についても検証しました。その結果は、皮膚科専門医が59.7%±7.1%であったのに対して、提案したシステムの正答率は74.5%±4.6%であり、こちらの結果についても統計的に有意に高い結果となりました。

まとめ

研究グループは提案するシステムを、十分な性能評価を行ったうえで、数年以内に実際の現場で使用可能にすることを目標としています。
希少な疾患の医用画像などのように、少量の学習データからどのように性能を向上させるかは重要な問題です。これらの知見を用いることで、データが少ない場合でも精度を出せるようになるかもしれません。また、GoogLeNetなどの学習済みモデルをベースにした分類器の学習方法は、ブログ等でも紹介されているので、皆さんも試してみる価値はあるでしょう。

参考資料

(宮澤和貴)