Composition and Structure Based GGA Bandgap Prediction Using Machine Learning Approach
本研究の学術的背景,研究課題の核心をなす学術的「問い」は?
本研究では、マシンラーニング(ML)の回帰モデルを開発し、化学組成と結晶構造からエネルギーバンドギャップ値を予測することが目的です。このバンドギャップ値の予測精度は、GGA-PBE計算法によるものと同等であることが求められています。この予測の検証は、密度汎関数理論(DFT)に基づくバンド構造計算によって行われます。
本研究の目的及び学術的独自性と創造性は?
本研究の目的は、化学組成と結晶構造からエネルギーバンドギャップ値を予測するためのマシンラーニングの回帰モデルの開発とその精度の検証です。これにより大規模なデータセットを分析することが可能になり、またマシンラーニングのアンサンブルモデルも開発されます。この独自性と創造性は、大規模なデータセットを対象に揃えた8つのML回帰モデルのパフォーマンスを比較解析すること、さらにアンサンブルモデルを開発することにあります。
本研究の着想に至った経緯や,関連する国内外の研究動向と本研究の位置づけは?
マシンラーニングは、学問分野だけでなく産業界においてもデータ分析における強力なツールとして出現し、大量のデータから新たな洞察や予測を導き出す能力が評価されています。本研究は、このマシンラーニングの手法を利用してエネルギーバンドギャップ値の予測モデルを開発し、その精度を検証するという目的で行われました。
本研究で何をどのように,どこまで明らかにした?
本研究では、化学組成と結晶構造からGGA-PBEバンドギャップ値を予測するためのマシンラーニングモデルを開発しました。大規模なデータセットを活用し、8つのML回帰モデルについて、そのパフォーマンスを比較解析した結果、RF(ランダムフォレスト)モデルが最も高いパフォーマンスを示し、R^2値が0.943、RMSE値が0.504 eVとなることを明らかにしました。さらにアンサンブルモデルによる予測では、バギングモデルが比較的良好なパフォーマンスを示し、最良の結果としてR^2値が0.948、RMSE値が0.479 eVを達成しました。
本研究の有効性はどのように検証した?
本研究では、性能の良かったMLモデルを使用して、新たなハーフホイスラー化合物のバンドギャップ値を予測しました。そして、DFT計算法による厳密な計算を行い、MLモデルによる予測と比較しました。その結果、DFT計算とMLモデルの予測値がよく一致し、新たな化合物は狭バンドギャップ半導体であることが示されました。これにより、MLモデルの予測精度が確認されました。