遺伝子疾患を顔画像のみから判別するDeepGestaltを発表(Nature Medicine Letters論文):遺伝子検査の前の簡便な診断サポートと倫理問題のバランスも課題

提案された遺伝子疾患識別モデルの概要
(患者例の顔画像は両親の許可を得て論文に掲載されています)

課題

個人に合わせた精密医療(プレシジョンメディシン)を低コストで早期に行うことは患者本人の健康だけでなく、医療費の効率的運用の観点からも制度全体の課題といえます。

 遺伝子疾患と呼ばれる遺伝子の欠損や変異による問題は内臓疾患や精神遅滞などの問題が現れることがあり、どの疾患であるかを早期に知ることは、(治療法が確立されていない遺伝子疾患も多いものの)その後の療育やサポートにとって有益な情報です。

遺伝子疾患は健康上の問題とともに顔貌に特徴が現れることが多く、具体的な部位の特徴とともに、「確かに違いはあるのだけれどどのような違いかを言い表すのが難しい」場合もあり、全体性を表す「ゲシュタルト(Gestalt)」による診断も行われています。しかし、子供の頃に顕著でも大人になると特徴が薄くなるなど、顔貌による診断方法も正確なものではありませんでした。

解決方法

イスラエル、ドイツ、アメリカの大学の研究者らが遺伝子疾患を顔画像から判別するシステムDeepGestaltに関する研究成果をNature Medicine Lettersで発表しました。オーソドックスな畳み込みニューラルネットワーク(CNN)を用いて識別します。

DeepGestaltでは、遺伝子検査により遺伝子疾患がわかっている患者の顔画像と遺伝子疾患の名前、問題のある遺伝子の情報を教師データとしてニューラルネットを学習します。教師データには健康な人の顔画像は含まれておらず、事前学習などは行わずに遺伝子疾患の患者の情報のみから学習しています。

まず、顔画像から顔の輪郭を検出して、上下方向を揃えて切り出して100×100ピクセルの画像にします。この際に顔全体、顔の上部、中央、下部という部分的な画像も作成し識別に用います。

テストとして、特定の遺伝子疾患か否かを判別する「二値分類問題」、「同一疾患からの遺伝子変異判別問題」「多種疾患判別問題」に取り組みました。

二値分類問題では、治療法の確立されていない遺伝子疾患であるコルネリア・デランゲ症候群、アンジェルマン症候群を題材として、それぞれ614人の患者と1079人のその他の患者、766人の患者と2669人のその他の患者といったデータセットを作成して学習を行い、その疾患か否かを当てられるか性能を比較しました。

遺伝子変異判別問題では、やはり根治治療の存在しないヌーナン症候群に対して、PTPN11、SOS1、RAF1、RIT1、KRASという遺伝子の変異があるかどうかを顔画像のみから判定する問題で、287人の患者のデータを用いて学習を行いました。

多種疾患判別問題では、216の遺伝子疾患を顔画像のみから判別する問題に取り組みました。この際には顔の部位ごとの画像のみから判断するモデルとそれぞれの判別結果を統合して総合判断するモデルを比較しました

どうなったか

二値分類問題では、コルネリア・デランゲ症候群で精度が96.88%(87%)、アンジェルマン症候群で精度が92%(71%)となり性能の向上が確かめられました(カッコ内は先行研究の最高成績)。

さらに二値分類問題について人の専門家による成績とDeepGestaltを比較した結果、人間の成績を上回りました(先行研究ではコルネリア・デランゲ症候群に関して62人の専門家の平均で75%)。

遺伝子変異判別問題では、ヌーナン症候群における遺伝子の変異を当てる問題に取り組み高い精度を達成しました。

多種の疾患を判別する問題では、複数の候補とともにその確からしさ(確率)を出力させて、上位10までに正解が入っていれば良いとする正解率を計算して、顔の上部のみで82%、耳の間の画像のみで81%、顔の下部のみで76.8%、顔全体で88.2%、これらの統合モデルで90.6%を達成しました。

まとめ

深層畳み込みネットワークを用いた遺伝子疾患識別システムDeepGestaltを紹介しました。

論文でも触れられているように、簡単に取得できる自然な顔画像から遺伝子疾患を判別できるために社会的・倫理的な問題もあります。例えば企業の採用面接の場でこっそり顔を撮影して、遺伝子疾患などの健康問題をあらかじめ知って選別し差別的な扱いをすることも可能となります。論文ではブロックチェーンを用いてデジタルフットプリント(利用履歴)を管理するアイディアについて触れられていますが、詳細はまだ何もないようです。

今後、顔画像だけでなく手軽な方法で本人の利害に直接関わる情報が取得される状況がやってきます。その時にために、画像識別モデルを撹乱させるAdversarial Exampleな化粧などを発達させる必要があるかもしれませんね。

参考資料

Gurovich et al, Identifying facial phenotypes of genetic disorders using deep learning, Nature Medicine Letters, 2019

コルネリア・デランゲ症候群:特徴的な顔貌(濃い眉毛、両側眉癒合、長くカールした睫毛、上向きの鼻孔、薄い上口唇、長い人中など)を主徴とする先天異常症候群。哺乳困難。両側性感音難聴が多い。側弯、成長障害、貧血、行動異常、先天性心疾患、心内膜炎、呼吸器感染、口蓋裂、屈折異常、停留精巣、先天性腎疾患などの症状。本質的な治療法はない。[小児慢性特定疾病情報センター]

アンジェルマン症候群:重度精神発達の遅れ、てんかん、失調性運動障害、容易に引き起こされる笑いなどの行動を特徴とする疾患。てんかん発作に対しては抗てんかん薬、睡眠障害に対しては睡眠薬などの対症療法。包括的な療育が望まれる。 [小児慢性特定疾病情報センター]

ヌーナン症候群:細胞内のRas/MAPKシグナル伝達系にかかわる遺伝子の先天的な異常によって、特異的顔貌、先天性心疾患、低身長、鎧状胸郭、停留精巣、精神遅滞などを示す常染色体優性遺伝性疾患。低身長に対するホルモン療法や対症療法が適応される。 [難病情報センター]

Noonan症候群とPTPN11遺伝子変異 市田蕗子 [日本小児循環器学会雑誌]

畳み込みニューラルネットワーク(CNN)[Math Works]

(森裕紀)