電荷ベースの原子シミュレーションのための事前学習済み汎用ニューラルネットワーク CHGNet

電荷ベースの原子シミュレーションのための事前学習済み汎用ニューラルネットワーク CHGNet

複雑な電子相互作用の大規模シミュレーションは、原子モデル化における最大の課題の 1 つです。古典的な力場は一般に電子状態とイオンの再配置との結合を記述できませんが、より正確な第一原理分子動力学は計算が複雑で、技術的に関連する現象を研究するために不可欠な、長くて大規模なシミュレーションを実行することができません。

最近、カリフォルニア大学バークレー校とローレンス・バークレー国立研究所の研究者らは、グラフニューラルネットワークに基づく機械学習原子間ポテンシャル(MLIP)モデル、クリスタル・ハミルトニアン・グラフ・ニューラル・ネットワーク(CHGNet)を提案しました。これは、普遍的なポテンシャルエネルギー面をモデル化できるものです。

この研究は、適切な化学反応を捉えるための電荷情報の重要性を強調し、これまで MLIP では観測できなかった追加の電子自由度を持つイオン系への洞察を提供します。

この研究は「電荷情報に基づく原子モデル化のための事前学習済み汎用ニューラルネットワークの可能性としてのCHGNet」と題され、2023年9月14日にNature Machine Intelligenceに掲載されました。

分子動力学 (MD) などの大規模シミュレーションは、固体材料の計算による探索にとって重要なツールです。しかし、分子動力学シミュレーションにおける電子相互作用やその微妙な効果の正確なモデル化は、依然として大きな課題となっています。古典的な力場などの経験的方法は、複雑な電子相互作用を捉えるには十分正確ではないことがよくあります。

密度汎関数理論 (DFT) と組み合わせた第一原理分子動力学 (AIMD) は、密度汎関数近似内で電子構造を明示的に計算することにより、量子力学的精度を備えた高精度の結果を生成できます。長期にわたる大規模なスピン偏極 AIMD シミュレーションは、イオンの移動、相転移、化学反応の研究に不可欠ですが、困難で計算量も膨大です。

ænet や DeepMD などの MLIP は、高価な電子構造法と効率的な古典的な原子間ポテンシャルの間のギャップを埋める有望なソリューションを提供します。しかし、化学結合に対する原子価の重要な影響を考慮することは、MLIP にとって依然として課題です。

電荷は、単純な酸化状態ラベルから量子力学から導かれる連続波動関数まで、さまざまな方法で表現されます。電荷情報を MLIP に組み込む際の課題は、表現の曖昧さ、解釈の複雑さ、ラベルの不足など、多くの要因から生じます。

CHGNet アーキテクチャ

CHGNet は、150 万を超える無機構造に対する 10 年以上の密度汎関数理論計算を含む Materials Project Trajectory Dataset (MPtrj) のエネルギー、力、応力、磁気モーメントに基づいて事前トレーニングされています。磁気モーメントを明示的に含めることで、CHGNet は電子の軌道占有率を学習して正確に表現できるようになり、原子と電子の自由度を記述する能力が向上します。

MPtrj データセット内の要素の分布を下図に示します。

図: MPtrj データセットの要素の分布。 (出典:論文)

ここで、研究者らは電荷を、磁気モーメント(マグモ​​ム)を含めることで推測できる原子特性(原子電荷)として定義しています。サイト固有のマグマを電荷状態制約として CHGNet に明示的に組み込むことで、潜在空間の正規化を強化し、電子相互作用を正確に捉えることができることを示します。

CHGNet の基礎は GNN であり、グラフ畳み込み層を使用して、エッジ {eij} で接続された一連のノード {vi} を通じて原子情報を伝播します。 GNN では、変換、回転、順列の不変性が保持されます。 CHGNet は、未知の原子電荷を持つ結晶構造を入力として受け取り、対応するエネルギー、力、応力、マグマを出力します。電荷で装飾された構造は、現地のマグマと原子軌道理論から推測できます。

図: CHGNet モデルのアーキテクチャ。 (出典:論文)

CHGNetでは、元のセル内の各原子vi内の隣接原子vjを検索することで、周期的な結晶構造を原子グラフに変換します

t 畳み込み層の後に更新された原子特徴がエネルギー予測に直接使用される他の GNN とは異なり、CHGNet は t−1 畳み込み層のノード特徴を正規化してマグマに関する情報を含めます。正規化された特徴は、局所的なイオン環境と電荷分布に関する豊富な情報を伝えます。したがって、エネルギー、力、応力を予測するために使用される原子特性は、電荷状態に関する情報によって制約される電荷​​です。したがって、CHGNet は、核の位置と原子の ID のみを入力として使用して電荷状態情報を提供できるため、原子モデルにおける電荷分布の研究が可能になります。

固体材料におけるCHGNetの応用

研究者らは固体材料におけるCHGNetのいくつかの応用を実証した。 Na2V2(PO4)3 における原子電荷の電荷制約と潜在空間正規化が実証され、LixMnO2 における電荷移動と相転移、LixFePO4 相図における電子エントロピー、ガーネット型リチウム超イオン伝導体 Li3+xLa3Te2O12 におけるリチウム (Li) と拡散率の CHGNet が示されています。

原子電荷の取り扱いを合理化するために、NASICON 型ナトリウムイオン陰極材料 Na4V2(PO4)3 を例として使用します。 CHGNet は、V 原子核の空間的配位から学習するだけでなく、V イオンの電荷分布に関する事前の知識がなくても、V イオンを三価 V と四価 V の 2 つのグループに区別することに成功しました。

図: Na2V2(PO4)3 におけるマグマムと潜在空間正規化。 (出典:論文)

CHGNet の識別能力は LixFePO4 の研究で強調されており、これは電子エントロピーと有限温度相安定性を含めるために重要です。

図: CHGNet からの LixFePO4 状態図。 (出典:論文)

LiMnO2 の研究では、CHGNet が長期電荷情報 MD を通じて、異価遷移金属酸化物系における電荷不均化と相転移の関係についての詳細な理解を提供できることが実証されました。

図: Li0.5MnO2 の相転移と電荷不均化。 (出典:論文)

次に、一般的なMDに対するCHGNetの精度を研究します。ガーネット導体中のリチウム拡散を研究した。

図: ガーネット Li3La3Te2O12 中のリチウム拡散速度。 (出典:論文)

結果は、活性化拡散ネットワーク効果が正確に捉えられているだけでなく、CHGNet の活性化エネルギーが DFT の結果と非常に一致していることを示しています。 CHGNet は、活性化された局所環境におけるリチウムイオン間の強い相互作用を正確に捉え、高度に非線形な拡散挙動をシミュレートできることを実証しました。さらに、CHGNet は、シミュレートされた拡散率の誤差を大幅に削減し、ナノ秒スケールのシミュレーションに拡張することで、拡散率の低いシステムの研究を可能にします。

さらに改善できる

上記の進歩にもかかわらず、さらなる改善が達成できる可能性があります。

まず、magmom を使用した価数状態の推論では、全体的な電荷の中性性が厳密に保証されるわけではありません。

第二に、magmom はイオン系におけるスピン偏極計算の原子電荷の優れたヒューリスティックですが、非磁性イオンの原子電荷の推論は曖昧になる可能性があり、そのため追加のドメイン知識が必要になることが認識されています。したがって、マグマのないイオンの場合、原子中心のマグマは原子電荷を正確に反映できず、CHGNet は他の MLIP の機能と同様に、環境から電荷を推測します。

このモデルは、電子局在関数、電気分極、原子軌道ベースの分割など、他の電荷表現方法を組み込むことでさらに強化できます。これらの方法は、潜在空間におけるアトミック特徴エンジニアリングに使用できます。

要約すると、CHGNet は、大規模な計算シミュレーションを使用して異原子価システムを研究するのに適した電荷ベースの原子シミュレーションを可能にし、計算化学、物理学、生物学、材料科学における電荷移動結合現象の研究機会を拡大します。

論文リンク: https://www.nature.com/articles/s42256-023-00716-3

<<:  DALL·E 3のベンチマーク!メタ最強の文豪エミュの技術レポートを公開

>>: 

推薦する

アンサンブル法の簡単な分析

パーソナライズされた推奨システムは、金融、電子商取引、メディア、ライブ放送などの業界における Dag...

ロボット革命が到来。人類社会はどう対応すべきか?

ロボット革命は、2009年に英国王立工学アカデミーが発表した「自律システム」と題する科学報告書で提唱...

AIの偏見に対処するための重要なステップ

バイアスは機械学習において対処または軽減する必要がある重大な問題です。企業は将来のプレッシャーを軽減...

...

ルールベースのAIと機械学習の主な違いは、さまざまな業界の企業が検討し、実装している点です。

さまざまな業界の企業が、ビッグデータからロボット工学まで、ビジネスプロセスの自動化、顧客体験の向上、...

...

...

MAmmoT により、LLM は形式論理と算術演算を学習する能力を備え、数学のジェネラリストになることができます。

数学的推論は、現代の大規模言語モデル (LLM) の重要な機能です。この分野では最近進歩が見られます...

我々は最初のAI戦争を目撃したかもしれない

[[409544]] 2021年5月初旬、イスラエルに住むパレスチナ人とイスラエル警察の間で激しい衝...

...

...

...

国際数学オリンピック連続優勝、基礎学問の科学技術戦略価値の分析

[[344622]] 第61回国際数学オリンピック(IMO)2020の結果が先日発表されました。中国...

2023年に最も注目すべきソフトウェアテスト業界のトレンドと動向の分析

2023年はソフトウェアテスト業界にとって変化とチャンスに満ちた年です。ソフトウェア業界の急速な発展...

テラデータCTO バオ・リミン:分析エンジンを使用して機械学習とディープラーニングを実現する

[51CTO.comよりオリジナル記事] 近年、機械学習、ディープラーニング、ビッグデータ分析が話題...