災害状況を適切に認識するための画像データセットをMITの研究グループが公開

課題

災害の頻発とその対応コストの増加に伴い、災害対応をサポートするテクノロジーの開発が重要になってきています。しかし、MIT Technology Reviewによると、実際のハリケーンにおいては、 商用の画像認識システムが重要なものを何一つ識別できないということが起こりました。 ほとんどのコンピュータービジョンシステムは日常の画像を用いて訓練されているため、被災地帯で関連のある細部を識別することができないのです。

解決方法

マサチューセッツ工科大学リンカーン研究所の研究者らは、 緊急対応状況に特有の写真と映像を集め、それに注釈を付けたデータセットをarxiv.orgで発表しました。このデータセットには62万枚以上の画像と、96時間に及ぶ映像があり、米国50州のすべてを網羅しています。画像や映像のほとんどは政府のデータベースやYouTube上のクリエイティブ・コモンズの映像から調達したものですが、研究所のスタッフ自身が撮影したものも含まれています。

データセットは、代表的な画像認識モデル訓練用データセットであるImageNetのデータ構造と同様に階層的なカテゴリを設定しています。例えば、ImageNetでは、哺乳動物(mammal)・胎生生物(placental )・肉食獣(carnivore)・イヌ科(canine)・犬・(dog)・作業犬(working dog) ・ハスキー(husky) といった形の階層構造でラベルがつけられています。今回のデータセットでも特定の詳細なカテゴリだけでなく、災害の特徴に関する階層的な表現か採用されています。例えば、「被害はあるか? はい/いいえ」「水はあるか? はい/いいえ」「水はそこにあっていいか? はい/いいえ」(川が氾濫しているのか)という形です。

また、この階層的なデータ表現はイメージや動画データ、撮影場所や時間などのメタデータ、カテゴリのアノテーション内容を含み、HDF5(hierarchical data format version 5)により管理されることで、容易にプログラムの中で使用することができます。

生のデータにはテラバイトのストレージが必要ですが、HDF5によるメタデータと注釈のインデックス作成にはギガバイトしか必要ありません。2019年には、このデータセットは米国国立標準技術研究所に技術移転される予定です。データセットの開発に使用されるソフトウェアの多くはGitHub上でBSD-2ライセンスの下でホストされています。MITLLの組織であるhttps://github.com/mit-llの管理のもと、「PSIAP-*。」というタイトルの関連リポジトリがあります。

どうなったか

コンピュータービジョンの専門家はデータセットを用いてモデルを訓練して分類器を作成することができます。またデータセットの中から、適切なデータを選んで災害関連の画像認識システムを訓練することもできます。こうしたシステムは、緊急時対応要員が災害状況から得た画像を迅速に処理するのに役立つといいます。最もひどく被害を受けた地域はどこか、予想される現場の状況はどういったものか、任務に必要などんな物資を準備すべきかを大量のデータから知ることができます。

まとめ

災害時、その状況を認識して、どこにどの程度の人員や食料、医療支援を配分するかの意思決定は、限られた資源を有効活用して効果を最大化するために非常に重要な要素です。これまでは、人間の判断に任されていましたが、SNSが発達した現在、ユーザが投稿する画像を収集して状況を自動的に認識して、意思決定者の助けとすることは有効な手段になるかもしれません。

参考資料

(蒲生由紀子・森裕紀)