割れ窓理論が実証される?:英国の政府統計がGoogle Street Viewから画像認識により予測できることが示される(Scientific Reports論文)

Suel et al. Measuring social, environmental and health inequalities using deep learning and street imagery 図1より

課題

街の雰囲気は、そこに住む人々により形作られます。人々はそれぞれの文化、収入に基づいて生活していますが、では、街の雰囲気や見た目は治安や経済格差、住民の健康状態とは関係があるのでしょうか?多くの人は体験的に持っている感覚ですが、客観的な実証は難しい問題です。この問いは、割れ窓理論と呼ばれるニューヨークのジュリアーニ元市長が取り入れて、街の治安回復に繋げたとされる理論とも関係があります。因果関係の推定は難しくても、客観的な評価ができれば、具体的な対策につなげるためのエビデンスとなるはずです。

解決方法

Imperial College Londonの研究者らは画像から直接、細かい地域で区切られた政府統計の値を直接求めることを試みました。この結果は、Nature系のオープンアクセス誌Scientific Reportsに掲載されています。

近年の画像認識で主に持ちられる畳み込みニューラルネットワークがこの研究でも使用されました。ネットワークの構成は、ImageNetと呼ばれる一般的な画像が含まれるデータベースを用いて学習された訓練済みネットワークであるVGG16を用いて画像の特徴を抽出し、その出力を各種統計情報を予測するためのネットワークに接続します。学習は、ロンドンにおけるGoogle Street Viewから得られた道路から見える街の画像を入力として、政府統計を出力とする対応に基づいて行いました。また、ロンドンの画像で学習したモデルが他の都市でも対応できるかも調べています。

どうなったか

画像から国勢調査で得られた政府統計の値が推定できました。推定したのは以下の項目を含む政府統計を10段階に評価した値です。

  • 自己報告の健康度合い
  • 失業率
  • 教育程度
  • 平均収入
  • 犯罪率

バーミンガム、マンチェスター、リーズの地域について、ロンドンで学習したモデルを試したところ、誤差が残っていました。それぞれの地域の少数のデータを用いて、ロンドンのモデルから追加的に学習を行うと、低コストで誤差が少なくなりました。

まとめ

この記事では、街の画像からその街の住民の様々な状況が推定できると主張する論文を紹介しました。この研究の結果だけでは、街の雰囲気が治安を向上させるかどうかは示すことができませんが、手間のかかる国勢調査を待たずに街の状況が推定できるため、適切な対応を取ることができるようになるかもしれません。

この調査はイギリスを対象としていましたが、日本や他の地域ではどうなのでしょうか?複数の角度からの検証を経た上で、成果を生かしてスマホで写真を取るだけで治安や住民の生活状況がわかり、政策にも生かされるようになればよいと思います。

参考資料