速度が1000倍になりました!拡散モデルは物質の錬金術プロセスを予測し、システムが複雑になればなるほど加速が大きくなる

速度が1000倍になりました!拡散モデルは物質の錬金術プロセスを予測し、システムが複雑になればなるほど加速が大きくなる

拡散モデルを使用して化学反応を予測すると、速度が1,000 倍向上します。

かつてはコンピューターで計算するのに数時間、あるいは 1 日かかっていた作業が、今では単一の GPU で6 秒で実行できるようになりました。

これはMITとコーネル大学が共同で行った新しい研究です。拡散モデルは、化学反応における最も重要な遷移状態の構造を予測するために使用されています。計算速度が1,000倍になるだけでなく、結果は予想外に正確です。関連する研究成果はNature Computational Scienceに掲載されました。

そのうち、MITのChenru Duan博士が第一責任著者です。さらに、コーネル大学博士課程の学生Yuanqi Du氏、MIT博士課程の学生Haojun Jia氏、MIT教授Heather Kulik氏もこの論文の共著者である。この研究はMIT Newsで報道されている。

ご存知のとおり、反応における遷移状態の構造を予測するのは、思っているほど簡単ではありません。

エネルギーが高いため、フェムト秒(1,000兆分の1秒)しか存在しない場合が多いです。

そのため、現在これを直接観測できる実験装置は存在せず、数時間から数日かかる量子化学計算によってのみ予測できる。

拡散モデルを使用してほぼ同じ予測結果を得るにはどうすればよいですか?

さらに、AIはどのような分野で化学反応を予測し、どのような役割を果たすことができるのでしょうか。

私たちは、この論文の著者であるMITのChenru Duan氏とコーネル大学のYuanqi Du氏にインタビューし、この研究の具体的な原理、その背後にある潜在的な応用の方向性、そして科学のためのAIについての考えについて議論しました。

拡散モデルを使用して化学反応を予測するにはどうすればよいですか?

まず、遷移状態が化学反応の研究にとって重要である理由を理解する必要があります。

古代の「錬金術」以来、化学は物質間の相互作用を理解し制御するための学問であり、化学反応はまさにその中核となる概念です。

一般的に、化学反応は、反応物、生成物、遷移状態構造の 3 つの要素で構成されます。

私たちは皆、反応物と生成物(水素と酸素が水を生成するなど)をよく知っていますが、実際には、この 2 つの間の遷移状態が化学反応を説明する鍵となります。

遷移状態は化学反応において最もエネルギーが高い状態であるため、化学反応のメカニズムを理解し、反応速度とエネルギーを推定するために使用できます。

簡単に言えば、化学反応を真に理解し、設計し、最適化し、制御したい場合は、遷移状態の構造から始める必要があります。

では、遷移状態の構造をどのように研究すればよいのでしょうか。また、予測を行うために AI を使用する必要があるのはなぜでしょうか。

遷移状態の構造を研究するには、分子構造を分析するだけでは不十分で、さらに進んでその3D 立体構造を研究する必要があります。

分子構造とは、化学反応を理解しやすくするために、単結合や二重結合などの概念を人工的に構築し、結合関係、原子の種類、量を使用して化学反応を表すことを指します。

しかし、化学反応の速度やエネルギーを本当に正確に計算するためには、3次元空間(3次元座標で表現)における原子の位置関係、つまり3次元立体配座を調べる必要があります。 3D 空間における原子の位置関係を比較することによってのみ、定量的な分析が可能になり、反応プロセスを予測できるようになります。

しかし、反応物や生成物と比較すると、遷移状態はフェムト秒のオーダーという非常に短い時間しか存在しません。

実験装置の精度の限界により、遷移状態の構造は肉眼で直接観察することができず、量子力学の方法、つまりシュレーディンガー方程式を通じてのみ計算することができました。

シュレーディンガー方程式は量子力学の基本方程式であり、粒子の状態が時間の経過とともにどのように変化するかを記述します。

しかし、シュレーディンガー方程式の計算量は膨大です。ベンゼン環の化学反応を計算するだけでも1週間かかることがあります。特に、系が大きくなる(原子の数が増えるなど)と、計算量は指数関数的に増加傾向を示します。

計算を高速化するために密度汎関数理論(DFT)などの近似法が登場しましたが、計算は依然として非常に遅く、収束の問題で失敗することもあります。「コストが非常に高く、エラー率も高いのです。」

この目的のために、MITとコーネル大学の研究者は、計算労力を節約するために、AI手法を使用して遷移状態の構造を直接予測するというアイデアを思いつきました。

Du Yuanqi 氏によると、拡散モデルを選択する主な理由は 3 つあります。

まず、発電効果は良好です。 GAN、VAE などのモデルと比較すると、拡散モデルは生成モデルの中でより優れたアーキテクチャです。

第二に、3Dコンフォメーションに適しています。離散データである分子構造と比較して、3D コンフォメーションは連続データであり、構造の対称性 (平行移動、回転、置換) を伴います。

離散データの場合、機械学習 + 検索に基づくモデルは、既存の (離散) 拡散モデルよりも適切に機能します。ただし、3D コンフォメーションの場合は、対称であるか連続データによって表されるかに関係なく、拡散モデルによって生成される方が適しています。

3 番目に、拡散モデル自体の柔軟性により、元の設計の一部を保持し、生成時に残りを埋めることができるため、新しい化学反応の設計にも役立ちます。

具体的には、アーキテクチャ設計の観点で、著者らは、等変 GNN を拡散モデルに統合し、等変 GNN がデータの対称性を適切に処理して保持できるOA-ReactDiffと呼ばれる構造を設計しました。

では、OA-ReactDiff の効果は何でしょうか。あるいは、他の AI と比較した最大の特徴は何でしょうか。

Duan Chenru氏は、この研究には2つの主なハイライトがあると述べた。

1つは予測精度です。OA-ReactDiffの精度は、これまでの一連のAIモデルの精度を上回っています。

著者らは、10,073 の化学反応を含む Transition1x をデータセットとして選択しました。各化学反応には、量子化学によって計算された反応物、生成物、遷移状態構造が含まれます。システム全体の原子数は 23 を超えません。

このうち、9,000 の化学反応がモデルのトレーニングに使用され、1,073 がテスト セットとして使用され、最終的に平均二乗平均平方根偏差 0.183 Å (1 Å = 0.1 ナノメートル)、中央値二乗平均平方根偏差 0.076 Å が達成されました。

PSI ベースや NeuralNEB などの他の機械学習手法と比較して、OA-ReactDiff はより高い精度を備えています。

同時に、意図的なトレーニングを行わなくても、OA-ReactDiff はより大規模なシステムでも優れた予測能力を示しました。

もう1つは予測速度です。OA-ReactDiffは既存の計算方法よりも少なくとも1,000倍高速です。

これは、密度汎関数理論アルゴリズムの元々の時間計算量は O(N³) レベルであったが、OA-ReactDiff メソッドに基づくと、時間計算量は直接 O(N²) に削減されるためです。

既存のデータセットを振り返ると、元々は計算に数時間、あるいは 1 日かかっていた化学反応が、OA-ReactDiff を使用するとわずか6 秒で完了できるようになりました。

さらに、システム内の化学反応が大きいほど、拡散モデルを予測に使用することによる高速化効果は大きくなります。

しかし、この研究は具体的にどこで活用できるのでしょうか?

また、2人の著者に、この研究の潜在的な応用と、科学研究自体におけるAIの利用についての見解についても尋ねました。

燃料薬の設計に役立てることができる

研究自体に関しては、Duan Chenru 氏は、研究には主に 3 つの機能があると考えています。

最も直感的な側面は、当然ながら触媒の設計です。

これは研究者が次に探求し続けたい方向性でもあり、つまりモデル自体を拡張し続け、触媒やその他の条件を追加し、AIを使用して遷移状態を予測することです。

触媒の研究を基に、燃料設計や新薬開発にも貢献します。

燃料を例にとると、関与する燃焼反応系は小さいことが多いですが、反応プロセスは環境や条件によって影響を受けやすいです。

そのため、AIを活用して化学反応の過程を予測することができれば、さまざまな燃料が反応する環境条件に基づいて、より迅速に影響を予測できるようになるかもしれません。

これはエネルギー産業、さらには航空宇宙産業にもさらなる影響を及ぼすでしょう。

最終的には、自然の化学反応をシミュレートして、新たな理論的研究の発展に役立てます。

例えば、地球上の生命の初期に起こった可能性のある反応をシミュレーションしたり、惑星のガス間の相互作用を探ったり、AIを使用して遷移状態を予測することで、新しい理論をより迅速に発見または検証し、生命の起源の重要性を探ることもできます。

AIは化学研究に多くの新たな進歩をもたらしたようですね。

近年、AI がバイオ医薬品 (AlphaFold2) や材料科学 (GNoME) で達成したさまざまなブレークスルーを考慮すると、AI は生化学、環境科学、材料科学などの一連の理論分野にとって新しい主流の技術ルートになったのでしょうか?

もっと極端に言えば、化学そのものに関して言えば、将来 AI が既存の量子化学研究の一部に取って代わることになるのでしょうか?

この点に関して、両著者は、 AI (少なくとも教師ありモデルに関する限り)は現時点ではまだこれらの分野のためのツールであり、完全に新しい技術的道筋ではないという同じ見解を持っています。

なぜなら、現時点では、生化学、環境材料科学、工学のどの分野においても、AI を研究支援に活用するための前提として、まだ一定の理論が確立されており、ツールとしての AI は「おまけ」の役割しか果たしていないからです。

つまり、これらの分野における AI と他の研究方法は依然として共存しており、「置き換え」の状況は発生しません。 Duan Chenru 氏はこれについて興味深い例え話をしました。

化学が饅頭に例えられるとすれば、機械学習の手法と既存のさまざまな化学的手法はそれぞれ異なる材料です。蒸しパンの中に肉や他の野菜を入れることもできます。

最近話題のGoogle Deepmindの研究であるGNoMEを例にとると、「ツールとしてのAI 」の良い例です。

Du Yuanqi 氏は、GNoME に関係する AI 手法を ML 専門家の観点から見ると、実は最新のものではないことに気づくだろうと考えています。たとえば、関係する幾何学的ディープラーニングは、近年人気の研究方向です。

しかし、材料科学の観点から見ると、安定した材料を探すこのような大規模でハイスループットな探索は、確かにかなりの科学的意義を持っています。

AI for Science 自体は、実際には「科学的発見」に重点を置いており、その大きな意義は科学的発見にあります。

Duan Chenru 氏は、応用の観点から見ると、材料の発見であれ、化学反応の予測であれ、AI を使用して実装を加速する最終的な目的は、依然として「有用」という言葉であると考えています。

今年の NeurIPS AI4Science ワークショップのテーマ「理論から実践へ」と同じです。これは今後 10 年間の AI4Science にとって避けられない道であり、中期的な使命でもあると私は信じています。

OA-ReactDiff の次の目標が適用可能なパスを見つけることであるのと同様に、GNoME は 220 万の安定した材料が適用の出発点にすぎないことを発見しました。化学と材料を特定の業界で真に「輝かせる」ためには、多くの標準 (熱伝導率、電気伝導率など) が必要です。

<<:  GPT-4V でさえ解明できない未来推論の解決策があります!華中科技大学と上海理工大学出身

>>: 

ブログ    

推薦する

2021年最新Contrastive Learning(対照学習)主要会議での必読古典論文解釈

みなさんこんにちは。私はDiaobaiです。最近、対照学習が流行っているので、ICLR2020では、...

脚付きロボットの新たなスキル:ANYmalは山登りを学んでいる

ロボット工学の研究者がここ数年で脚付きロボットで成し遂げたことは実に驚くべきことだ。昨年7月、オレゴ...

年末総括: 2021 年の人工知能 (AI) と機械学習 (ML) の 5 つの主要な開発トレンド

[[359772]]来年、AI テクノロジーはビジネス業務にさらに深く浸透するでしょう。人工知能 (...

今日から彼は、黄仁訓院士です!米国工学アカデミーの2024年会員リストが発表され、清華大学の黄一東氏らが外国人会員に選出される

本日、2024年度の米国工学アカデミーの新会員リストが発表されました! Nvidiaの黄氏が選出され...

MITは、音声チャットを通じて実験を行うことができる実験科学者向けの大規模モデルアシスタントを構築しました。

現在、人工知能や自律実験は主にPythonなどの言語で書かれています。しかし、実験科学者全員がそのよ...

10億枚の画像で訓練されたFacebookの新しいAIモデルは、コンピュータービジョンに革命を起こす可能性がある

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

Google Gemini がゲームを逆転!マルチモーダル機能は GPT-4V と同等 | 香港中国語 128 ページの総合評価レポート

Google がゲームを撤回しました! Gemini が API を公開してから1 週間も経たないう...

...

カメラか LiDAR か?堅牢な 3D オブジェクト検出を実現するにはどうすればよいでしょうか?最新レビュー!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

メーター読み取りシステムにおける無線データ伝送モジュールの応用

周知のとおり、従来の手動メーター読み取り方法は時間がかかり、労働集約的であり、その正確性と適時性は保...

Googleの人工知能研究所DeepMindがカナダで研究者を募集

2014年にグーグルが買収したロンドンを拠点とする人工知能研究所ディープマインドは、世界最高のAI研...

GPT-4 は AGI のきっかけとなるだけでしょうか? LLMは最終的に廃止され、世界モデルが未来となる

人間の認知においては、汎用人工知能(AGI)を人工知能の究極の形、およびその開発の究極の目標として設...

テクノロジーの専門家が若者と対談、第1回JD全国大学生アルゴリズム設計・プログラミングエリート競技会セミナーが開催されました

最近、「2021 JD全国大学生アルゴリズム設計・プログラミングエリートコンテスト-コードの無限の想...

機械学習のための特徴選択の5つの方法!

使用される特徴の数が増えるにつれて、モデルのパフォーマンスが向上することが分かっています。ただし、ピ...