顔情報を利用した深層学習モデルの光と影:顔認証技術の発展とデータ生成の可能性

課題

個人認証や顔特徴からの疾患推定、表情による感情推定など、顔情報を適切に処理することで様々なアプリケーションが実現可能となります。これまでは画像から人間の顔を発見する顔検出技術がデジタルカメラをはじめとする機器で利用されていましたが、高精度にそして頑健に個人認証をすることは困難でした。
近年、深層学習をはじめとする機械学習技術の発展により顔画像を用いた個人認証や特徴推定技術が進歩し、様々な分野での応用が進んでいます。また機械学習モデルの一つである生成モデルによる顔画像生成の技術も進歩しています。一方で、このような技術を利用した偽画像による情報操作も問題になってきています。今回はこのような顔認識システムや顔画像生成モデル、そしてそれらが抱える可能性と問題についてまとめました。

解決方法

深層学習やその他の機械学習技術の発展により、顔画像認証や顔画像生成に関する技術とその応用先が広がっています。顔画像認証や認識システムの例としては、パナソニック株式会社が開発したFaceProや遺伝子疾患を顔画像のみから判別するDeepGestaltが挙げられます。FaceProは画像処理の分野で一般的に利用される畳み込みニューラルネットワーク(CNN)を基にしたResNeXt50やGoogLeNetなど複数の深層学習モデルの構造を融合したネットワークを構築することで、斜め顔や経年変化、サングラスやマスクによる部分隠蔽顔の照合が可能な技術です。アメリカ国立標準技術研究所が公開するセキュリティカメラ映像データセットを用いた評価では従来技術と比較して最大5倍の認識精度を示しました。DeepGestaltでは顔画像全体(Gestalt)の情報を処理するために輪郭を検出して切り出した顔画像をCNNに入力し、抽出された特徴量から特定の遺伝子疾患があるか否かを判別する識別機を学習しました。
一方で顔画像生成に関する技術では、変分自己符号化器(VAE)敵対的生成ネットワーク(GAN)が利用されています。ある動画像中の顔画像を別人のものに変える通称DeepFakeと呼ばれる技術では、VAEを利用することで元画像中の人の顔を一度特徴空間に落とし込み、そこから変換したい顔画像を学習したVAEによって画像を生成することで顔画像の変換を行います。また株式会社Preferred Networksが開発を進めるキャラクター生成プラットフォームCrypkoでは、GANを利用したキャラクターの生成・合成技術が利用されています。様々な画像をGANによって学習させることでその潜在的な特徴量と関係性を抽出し、画像に特定のマスクを加えてその部分の潜在特徴量を変更することで、一部の画像のみを変更したりキャラクターの合成を行うことができます。Crypkoに関する技術やより詳細な情報はこちらこちらをご覧ください。

どうなったか

顔画像認証や認識システムのFaceProはその高精度、頑健な個人認証能力によって空港などの公共施設の監視や入場管理業務に利用されています。類似の技術を利用した取り組みとして、学校法人兵庫医科大学では顔認証機能端末を用いた学生出欠管理システム(西日本電信電話株式会社の提供)の利用を開始しました。これにより正確かつ高速に出欠確認を行うと主に教職員の業務効率化が期待されます。またDeepGestaltを利用した遺伝子疾患寝台アプリケーションのFace2Genが開発され、医師診断の補助としても利用されています。
顔画像生成技術を利用したアプリケーションとしては、上述したCrypkoや株式会社データグリッドが開発するアイドル画像の自動生成システムが存在します。一方でDeepFakeを利用した偽画像による名誉棄損など、残念ながら技術が悪用される例も存在しています。

まとめ

顔画像認証や認識、顔画像生成に関する技術とその応用例について説明しました。機械学習技術の目覚ましい発展により素晴らしいアプリケーションが開発される一方で、技術が悪用されるという問題も明らかになりました。偽画像の問題に対しては、国立情報学研究所の研究グループが動画中の顔画像が本物か否かを判別するモデルを提案しており、技術の悪用をより新しい技術で抑止することが可能となりつつあります。
ただし画像生成技術は利用方法によっては非常に有用であり、例えば少ない学習データの補填による認識システムの性能改善や、心理学実験における刺激画像の作成などが可能です。技術の特性を理解しよりよく利用していくことが重要になります。

参考資料

(堀井隆斗)