ヒッグス粒子がボトムクォーク対に崩壊する事象の確認に成功:最新素粒子物理学実験における目的事象データと背景事象データの分離に機械学習を応用

課題

欧州合同原子核研究機関(CERN)では大型ハドロン衝突型加速器(LHC)を用いた実験により、理論によって予測された新粒子や粒子の生成崩壊過程の発見を目指しています。LHCは2015年から衝突エネルギーを13TeVに増強し、現在までに大量のデータを蓄積してきました。一方で、これらのデータは目的事象だけでなく、背景事象が大量に含まれており、高い純度を保ったデータの獲得は難しいという問題があります。素粒子実験では背景事象に対し5σ以上の有意水準が確認された場合のみ発見を認められるため、目的事象の統計数をいかに確保できるかが問題となり、高い純度の目的事象データを背景事象データから分離する能力が重要となります。

解決方法

機械学習などの解析技術を活用することで背景事象の除去に成功し、結果としてヒッグス粒子がボトムクォーク対に崩壊した事象を確度5.4σの有意水準で観測することに成功しました。

ここで使われている機械学習の目標は目的事象のデータと背景事象のデータの分離です。これは事象内の粒子が持つ複数の物理量からなる多変量解析であり、機械学習による2値分類問題です。今回の成功は、Boosted Decision Tree(BDT)と呼ばれる決定木によるアンサンブル学習によるもので、比較的データ数が少なくても大きな分離性能を持たせることができます。

どうなったか

機械学習による目的事象と背景事象の分離能力の向上により、ヒッグス粒子がボトムクォークと相互作用(湯川結合)することが実験によって明らかになりました。今回の成果により、第3世代フェルミ粒子とヒッグス粒子の相互作用がすべて観測されたため、物質を構成するフェルミオンと力を伝えるボソン、ともに同じヒッグス機構で質量を得ていることが判明しました。

まとめ

最先端の物理である素粒子実験においてもAIが使われているという事例を紹介しました。各事象のデータが持つ多変量の物理量から目的事象を背景事象から効率よく分離することで、ヒッグス粒子がボトムクォーク対に崩壊する事象を確度5.4σの有意水準で観測することに成功しました。

多変量データを持つビックデータの解析には機械学習、特にデータ数が多い場合はディープニューラルネットワーク(DNN)が有効であると考えられています。CERNではDNNとBDTによる分離の精度を比較研究していますが、今回はBDTを利用しております。これはデータ数が少なかったために、DNNよりもBDTの方が精度が高くなったためだと考えられます。

データサイエンスや機械学習はこのように他の分野の研究と共同で開発することで、フロンティアを切り開いていく可能性を秘めています。

参考資料

(H.S.)