深層学習モデルが台風のタマゴを検出:気候実験データと畳み込みニューラルネットワークによる新たな台風発生予測手法

課題

台風などの熱帯低気圧の発生予測には、気象観測衛星による雲の観測データを用いた気象モデルのシミュレーション情報が利用されています。しかし地球上の大気現象は刻一刻と変化するため、気象モデルを用いて遠い将来を予測する場合には結果に大きなばらつきが伴います。そのため、現在観測されている雲の集団が熱帯低気圧に発達するかどうかを精確に、また長期的に予測することは困難でした。
このような課題に対して、海洋研究開発機構の松岡大祐技術研究員らは、近年急速に発展している深層学習モデルと全球雲システム解像モデル(NICAM)による大量の気候実験データを用いることで、発生前の熱帯低気圧の予兆を示す雲(ここでは熱帯低気圧のタマゴと呼称)を精度よく検出する手法を開発しました。この手法に関する情報は、日本地球惑星科学連合の英文誌Progress in Earth and Planetary Scienceの電子版に掲載されました。

解決方法

深層学習モデルを用いて熱帯低気圧のタマゴを検出するためには、非常に多くの気候実験データが必要となります。そこで松岡研究員らは、NICAMによる20年分の気候実験データに対して熱帯低気圧の追跡アルゴリズムを適用することで、熱帯低気圧のタマゴおよび発達中の熱帯低気圧画像5万枚を取得しました。また、熱帯低気圧に発達しなかった雲画像100万枚も取得しています。これら105万枚の雲画像から、熱帯低気圧のタマゴの雲画像5万枚と発達しなかった雲画像5万枚の学習データを10組作製し、畳み込みニューラルネットワーク(CNN)にそれぞれ学習させることで10種類の識別器を構築しました。また10種類の識別器の結果を用いてアンサンブル学習することで、最終的な識別器を構築しています。

どうなったか

構築した識別器に対して10年分の未学習データを入力し、熱帯低気圧およびそのタマゴがどの程度ただしく検出できるか検証したところ、最も良い検出精度としては、9個の熱帯低気圧・タマゴのうち8個を検出しまたした(検出率88.9%)。また、NICAMの82の領域において熱帯低気圧・タマゴの検出をしたところ、誤検出はわずか8領域のみでした。
さらに構築した識別器において海域毎に検出性のを評価したところ、北西太平洋における検出率が最も高く、北インド洋が最も低いという結果が得られました。この結果は各海域における熱帯低気圧の寿命や長さ、学習データ数に依存しています。北西太平洋では10年分の未学習データによる評価で、発生2日前、5日前、7日前の熱帯低気圧のタマゴをそれぞれ91.2%、77.8%、74.8%で検出できました。より詳細な検証結果はこちらをご覧ください

まとめ

深層畳み込みネットワークと気象シミュレーションモデルである全球雲システム解像モデルによる大量の気候実験データを用いることで、発生前の台風のタマゴを精度よく検出するシステムについて紹介しました。これまの台風予想は計測データを基にした気象モデルのシミュレーション、Model-drivenの手法が中心でしたが、大量のシミュレーションデータを解析するData-drivenの手法が提案されつつあります。今後はロング・ショートタームメモリ(LSTM)に代表される時系列モデルを用いることで、台風の経路予測や集中豪雨の発生予測への応用が期待されています。
今回のモデルのようにシミュレーションデータを学習する手法は、現実世界でのデータ取得が困難な場合に有用になると考えられます。時間のかかるシミュレーション結果を深層学習モデルで予測するなど、それぞれの特徴を活かすことが重要です。

参考資料

(堀井隆斗)