材料科学は、私たちの日常生活のあらゆる技術的進歩の基盤となっています。しかし、新しい材料の開発には時間がかかり、コストもかかります。
そんな中、大規模な深層学習を利用した研究が、結晶構造や化学組成に基づく材料の特性を効果的にモデル化し、結果として220万もの新しい構造の発見に成功しました。
本記事では、その研究における背景や実験結果などを紹介します。
参照論文情報
- タイトル:Scaling deep learning for materials discovery
- 著者:Amil Merchant, Simon Batzner, Samuel S. Schoenholz, Muratahan Aykol, Gowoon Cheon, Ekin Dogus Cubuk
- 所属:DeepMind
- URL:https://doi.org/10.1038/s41586-023-06735-9
- GitHub:https://github.com/google-deepmind/materials_discovery
- プロジェクトページ:https://materialsproject.org/gnome
本記事の関連研究:新しい科学的方程式を導くための機械学習ツール プリンストン大の研究者が発表
材料科学における従来の課題
材料科学には長年にわたる大きな課題が存在しています。それは、新しい無機結晶の発見において、これまでのアプローチでは、高コストで時間を要する試行錯誤に依存してきたという点です。
無機材料はエネルギー、情報処理、環境技術など、多岐にわたるアプリケーションに不可欠な要素であり、新しい材料の発見が技術革新のもとになります。
従来の実験的方式では、数十年で約20,000件の安定構造がカタログ化されてきましたが、これは本来発見されるべき材料全体のごく一部にすぎないと言われています。実験室での合成は複雑で、多くの場合、予測不可能である、というのが一因です。
また、計算的なアプローチに関しては、ある程度の進展を遂げてきましたが、こちらも限界があります。マテリアルズプロジェクト(Materials Project)やオープン量子材料データベース(Open Quantum Materials Database, OQMD)などは、第一原理計算に基づいて、多くの材料を予測してきました。しかし、実際の物理的エネルギーを近似するに留まり、新しい材料の安定性を正確に予測することはできていません。
このように、新しい材料の発見と特定には、①時間がかかり、②コストが高く、③予測が困難であるという大きな課題がありました。
本記事の関連研究:ChatGPTで「論文から非常に正確なデータ抽出」ができるとの報告
大規模なアクティブラーニング+GNNによるアプローチ
上記のような従来の課題に対処するため、研究者たちは、新しい解決策を模索しました。そして考案されたアプローチが、大規模な機械学習と最先端のグラフニューラルネットワーク(GNN)の組み合わせになります。以下はアプローチ全体の大きな要素の紹介です。
1. データセットの構築
既存のデータベースから大量の結晶構造データを収集し、安定な結晶構造の広範なカタログを作成しました。
2. 新しい候補構造の生成
対称性認識型部分置換(SAPS)やランダム構造探索などの方法を使用して、新しい候補構造を生成することから始まります。未探索の材料構造を探求し、分析のための新しいデータセットを作成するプロセスです。
3. 大規模なアクティブラーニング
モデルが不確実性の高いデータから学習し、より迅速かつ効果的に知識を蓄積する方法として、大規模なアクティブラーニングを通した機械学習モデルの訓練が採用されました。このステップは、データを効率的に処理し、新しい材料の発見に役立てるための基盤を形成します。
4. グラフニューラルネットワーク(GNN)
アクティブラーニングで得られたデータとGNNを用いて、結晶構造や化学組成の複雑な関係を捉え、材料の特性を正確にモデル化します。これが最終的に新しい材料の性質を理解し、有望な候補を特定するプロセスです。
本記事の関連研究:Natureなどの論文約4,800本でGPT-4による査読能力が検証され、「LLMは査読にも有用」と結論
実験結果
1. 新しい構造の発見
この研究のアプローチにより、
また記事の購読には、アカウント作成後の決済が必要です。
※ログイン/初回登録後、下記ボタンを押してください。
AIDBとは
プレミアム会員(記事の購読)について
■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。