NECと東北大学が機械学習を用いた「開発者が解釈可能なマテリアルズ ・インフォマティクス」の手法を開発し熱電変換素子の性能を向上

課題

Marvinでも取り上げているように、近年、自然科学領域においても機械学習を用いて材料開発を行うマテリアルズ・インフォマティクスや、物理探求を行うフィジクス・インフォマティクスが注目されています。しかし、ロボットにより行われる自動実験で得られたデータが本来持つ不完全性を機械学習側で考慮するしくみがなかったため、材料開発の効率を上げられないという課題がありました。さらに、もともとこの分野は、理論科学者、計算科学者、データ科学者の主導で新材料や新機能の探索手法として発展してきており、開発現場には研究者・技術者の経験と勘が必要とされ、非効率が多く残っている分野です。

(参考:慶應・東大らの研究チームがスパースモデリングを活用し、世界最高水準の有機負極材料を発見MI-6株式会社が株式会社リバネスと資本業務提携:マテリアルズ・インフォマティクス分野への貢献に期待

解決方法

日本電気株式会社(NEC)と東北大学は、メリーランド大学と共同で、実験データ生成の省力化技術と、材料特性に対する高精度での予測とその解釈性を与える技術に加え、材料の特性向上に関わる無数の要因から主要因を効率良く抽出する手法を開発しました。この手法はNature Computational Materials誌で発表されています。

これまで、3者はロボティクス技術による自動実験の仕組みと、解釈可能な機械学習(Explainable AI)を組み合わせた「開発者が解釈可能なマテリアルズ・インフォマティクス」を開発してきましたが、今回はさらにこの手法を用いて、NECが発見したスピンゼーベック効果を用いたスピン熱電変換材料の性能向上の実証にも成功しました。

一般にマテリアル関連のデータセットは、実験や計算・シミュレーションに要する時間のため、他の科学分野のデータセットに比べて非常に小さいことが多く、物質を構成するパラメータの空間の中でのデータの密度が大幅に低下します。したがって、重要な属性のみを自動的に選択し、検索空間の次元を縮小するスパースモデリング手法(少ない情報から全体像を的確にあぶり出す科学的モデリング手法)は非常に有用となります。

最も一般的なスパースモデリング手法のひとつは、線型モデルを前提としたLASSO回帰(※)ですが、線形モデルは必ずしも予測精度が高いとは限りません。高い予測精度を達成するためには、非線形性を有するサポートベクターマシン(SVM)、ディープニューラルネットワーク(NN)、ランダムフォレスト(RF)などのモデルが必要とされることが多くなりますが、非線形モデルは一般に解釈性に欠けています。つまり、機械学習モデルにとってどの属性が重要であるかを知ることはできるが、属性がどのように寄与しているのかを明らかにすることはほとんどできず、実用的な情報を抽出することは容易ではありませんでした。

これにはNECの独自技術である「異種混合学習技術」が活用されています。今回の異種混合学習技術では多種多様なデータに混在するデータ同士の関連性から、特定の規則性を自動で発見し、分析するデータに応じて参照する規則を切り替えます。

これまでの手法では、スピン熱電材料の性能には数十~百個程度の要因が関係していると示唆されたものの、要因が多すぎるため実際の実験による探索効率が向上できませんでした。今回の手法では、ロボットによる大量の実験の結果を基に欠損した組み合わせに関するシミュレーションを行い、実験とシミュレーションのデータの双方に対して同時に機械学習モデルを適用して、解釈可能な少数要因を抽出することに成功しています。

どうなったか

これにより、単一の規則性のみを発見してそれを参照するような従来の機械学習では分析が困難であった「規則性が変化するデータ」でも、高精度な予測や異常検出が可能になります。

さらに、この機械学習モデルを物理・化学等の専門的な知見を持つ開発者が考察して熱電性能に関係する主な要因を絞りこみ、効率良く実験を進めることで性能向上を実証しました。

まとめ

プレスリリースでは、「本システムから得られる示唆を材料開発者が考察し、実験を繰り返すことで、開発者だけでは見つけられずにいた新材料・新物性の発見の可能性を広げます」と述べられています。今回の研究で、小規模なデータ、経験および直観を大事にする実験主導のマテリアルインフォマティクスにおいて、機械学習がうまく取り入れられつつあるといえそうです。

参考資料

※ Lasso回帰モデル:入力変数に掛かる係数の絶対値の合計が小さくなる制約が与えられており、必要性の少ない入力への係数は0となる。最終的に、0となった係数を持つ入力が最初からなかったとして、小さなモデルを作ることができる。

(蒲生由紀子)