速度が1000倍になりました！拡散モデルは物質の錬金術プロセスを予測し、システムが複雑になればなるほど加速が大きくなる

拡散モデルを使用して化学反応を予測すると、速度が1,000 倍向上します。

かつてはコンピューターで計算するのに数時間、あるいは 1 日かかっていた作業が、今では単一の GPU で6 秒で実行できるようになりました。

これはMITとコーネル大学が共同で行った新しい研究です。拡散モデルは、化学反応における最も重要な遷移状態の構造を予測するために使用されています。計算速度が1,000倍になるだけでなく、結果は予想外に正確です。関連する研究成果はNature Computational Scienceに掲載されました。

そのうち、MITのChenru Duan博士が第一責任著者です。さらに、コーネル大学博士課程の学生Yuanqi Du氏、MIT博士課程の学生Haojun Jia氏、MIT教授Heather Kulik氏もこの論文の共著者である。この研究はMIT Newsで報道されている。

ご存知のとおり、反応における遷移状態の構造を予測するのは、思っているほど簡単ではありません。

エネルギーが高いため、フェムト秒（1,000兆分の1秒）しか存在しない場合が多いです。

そのため、現在これを直接観測できる実験装置は存在せず、数時間から数日かかる量子化学計算によってのみ予測できる。

拡散モデルを使用してほぼ同じ予測結果を得るにはどうすればよいですか?

さらに、AIはどのような分野で化学反応を予測し、どのような役割を果たすことができるのでしょうか。

私たちは、この論文の著者であるMITのChenru Duan氏とコーネル大学のYuanqi Du氏にインタビューし、この研究の具体的な原理、その背後にある潜在的な応用の方向性、そして科学のためのAIについての考えについて議論しました。

拡散モデルを使用して化学反応を予測するにはどうすればよいですか?

まず、遷移状態が化学反応の研究にとって重要である理由を理解する必要があります。

古代の「錬金術」以来、化学は物質間の相互作用を理解し制御するための学問であり、化学反応はまさにその中核となる概念です。

一般的に、化学反応は、反応物、生成物、遷移状態構造の 3 つの要素で構成されます。

私たちは皆、反応物と生成物（水素と酸素が水を生成するなど）をよく知っていますが、実際には、この 2 つの間の遷移状態が化学反応を説明する鍵となります。

遷移状態は化学反応において最もエネルギーが高い状態であるため、化学反応のメカニズムを理解し、反応速度とエネルギーを推定するために使用できます。

簡単に言えば、化学反応を真に理解し、設計し、最適化し、制御したい場合は、遷移状態の構造から始める必要があります。

では、遷移状態の構造をどのように研究すればよいのでしょうか。また、予測を行うために AI を使用する必要があるのはなぜでしょうか。

遷移状態の構造を研究するには、分子構造を分析するだけでは不十分で、さらに進んでその3D 立体構造を研究する必要があります。

分子構造とは、化学反応を理解しやすくするために、単結合や二重結合などの概念を人工的に構築し、結合関係、原子の種類、量を使用して化学反応を表すことを指します。

しかし、化学反応の速度やエネルギーを本当に正確に計算するためには、3次元空間（3次元座標で表現）における原子の位置関係、つまり3次元立体配座を調べる必要があります。 3D 空間における原子の位置関係を比較することによってのみ、定量的な分析が可能になり、反応プロセスを予測できるようになります。

しかし、反応物や生成物と比較すると、遷移状態はフェムト秒のオーダーという非常に短い時間しか存在しません。

実験装置の精度の限界により、遷移状態の構造は肉眼で直接観察することができず、量子力学の方法、つまりシュレーディンガー方程式を通じてのみ計算することができました。

シュレーディンガー方程式は量子力学の基本方程式であり、粒子の状態が時間の経過とともにどのように変化するかを記述します。

しかし、シュレーディンガー方程式の計算量は膨大です。ベンゼン環の化学反応を計算するだけでも1週間かかることがあります。特に、系が大きくなる（原子の数が増えるなど）と、計算量は指数関数的に増加傾向を示します。

計算を高速化するために密度汎関数理論（DFT）などの近似法が登場しましたが、計算は依然として非常に遅く、収束の問題で失敗することもあります。「コストが非常に高く、エラー率も高いのです。」

この目的のために、MITとコーネル大学の研究者は、計算労力を節約するために、AI手法を使用して遷移状態の構造を直接予測するというアイデアを思いつきました。

Du Yuanqi 氏によると、拡散モデルを選択する主な理由は 3 つあります。

まず、発電効果は良好です。 GAN、VAE などのモデルと比較すると、拡散モデルは生成モデルの中でより優れたアーキテクチャです。

第二に、3Dコンフォメーションに適しています。離散データである分子構造と比較して、3D コンフォメーションは連続データであり、構造の対称性 (平行移動、回転、置換) を伴います。

離散データの場合、機械学習 + 検索に基づくモデルは、既存の (離散) 拡散モデルよりも適切に機能します。ただし、3D コンフォメーションの場合は、対称であるか連続データによって表されるかに関係なく、拡散モデルによって生成される方が適しています。

3 番目に、拡散モデル自体の柔軟性により、元の設計の一部を保持し、生成時に残りを埋めることができるため、新しい化学反応の設計にも役立ちます。

具体的には、アーキテクチャ設計の観点で、著者らは、等変 GNN を拡散モデルに統合し、等変 GNN がデータの対称性を適切に処理して保持できるOA-ReactDiffと呼ばれる構造を設計しました。

では、OA-ReactDiff の効果は何でしょうか。あるいは、他の AI と比較した最大の特徴は何でしょうか。

Duan Chenru氏は、この研究には2つの主なハイライトがあると述べた。

1つは予測精度です。OA-ReactDiffの精度は、これまでの一連のAIモデルの精度を上回っています。

著者らは、10,073 の化学反応を含む Transition1x をデータセットとして選択しました。各化学反応には、量子化学によって計算された反応物、生成物、遷移状態構造が含まれます。システム全体の原子数は 23 を超えません。

このうち、9,000 の化学反応がモデルのトレーニングに使用され、1,073 がテストセットとして使用され、最終的に平均二乗平均平方根偏差 0.183 Å (1 Å = 0.1 ナノメートル)、中央値二乗平均平方根偏差 0.076 Å が達成されました。

PSI ベースや NeuralNEB などの他の機械学習手法と比較して、OA-ReactDiff はより高い精度を備えています。

同時に、意図的なトレーニングを行わなくても、OA-ReactDiff はより大規模なシステムでも優れた予測能力を示しました。

もう1つは予測速度です。OA-ReactDiffは既存の計算方法よりも少なくとも1,000倍高速です。

これは、密度汎関数理論アルゴリズムの元々の時間計算量は O(N³) レベルであったが、OA-ReactDiff メソッドに基づくと、時間計算量は直接 O(N²) に削減されるためです。

既存のデータセットを振り返ると、元々は計算に数時間、あるいは 1 日かかっていた化学反応が、OA-ReactDiff を使用するとわずか6 秒で完了できるようになりました。

さらに、システム内の化学反応が大きいほど、拡散モデルを予測に使用することによる高速化効果は大きくなります。

しかし、この研究は具体的にどこで活用できるのでしょうか?

また、2人の著者に、この研究の潜在的な応用と、科学研究自体におけるAIの利用についての見解についても尋ねました。

燃料薬の設計に役立てることができる

研究自体に関しては、Duan Chenru 氏は、研究には主に 3 つの機能があると考えています。

最も直感的な側面は、当然ながら触媒の設計です。

これは研究者が次に探求し続けたい方向性でもあり、つまりモデル自体を拡張し続け、触媒やその他の条件を追加し、AIを使用して遷移状態を予測することです。

触媒の研究を基に、燃料設計や新薬開発にも貢献します。

燃料を例にとると、関与する燃焼反応系は小さいことが多いですが、反応プロセスは環境や条件によって影響を受けやすいです。

そのため、AIを活用して化学反応の過程を予測することができれば、さまざまな燃料が反応する環境条件に基づいて、より迅速に影響を予測できるようになるかもしれません。

これはエネルギー産業、さらには航空宇宙産業にもさらなる影響を及ぼすでしょう。

最終的には、自然の化学反応をシミュレートして、新たな理論的研究の発展に役立てます。

例えば、地球上の生命の初期に起こった可能性のある反応をシミュレーションしたり、惑星のガス間の相互作用を探ったり、AIを使用して遷移状態を予測することで、新しい理論をより迅速に発見または検証し、生命の起源の重要性を探ることもできます。

AIは化学研究に多くの新たな進歩をもたらしたようですね。

近年、AI がバイオ医薬品 (AlphaFold2) や材料科学 (GNoME) で達成したさまざまなブレークスルーを考慮すると、AI は生化学、環境科学、材料科学などの一連の理論分野にとって新しい主流の技術ルートになったのでしょうか?

もっと極端に言えば、化学そのものに関して言えば、将来 AI が既存の量子化学研究の一部に取って代わることになるのでしょうか?

この点に関して、両著者は、 AI （少なくとも教師ありモデルに関する限り）は現時点ではまだこれらの分野のためのツールであり、完全に新しい技術的道筋ではないという同じ見解を持っています。

なぜなら、現時点では、生化学、環境材料科学、工学のどの分野においても、AI を研究支援に活用するための前提として、まだ一定の理論が確立されており、ツールとしての AI は「おまけ」の役割しか果たしていないからです。

つまり、これらの分野における AI と他の研究方法は依然として共存しており、「置き換え」の状況は発生しません。 Duan Chenru 氏はこれについて興味深い例え話をしました。

化学が饅頭に例えられるとすれば、機械学習の手法と既存のさまざまな化学的手法はそれぞれ異なる材料です。蒸しパンの中に肉や他の野菜を入れることもできます。

最近話題のGoogle Deepmindの研究であるGNoMEを例にとると、「ツールとしてのAI 」の良い例です。

Du Yuanqi 氏は、GNoME に関係する AI 手法を ML 専門家の観点から見ると、実は最新のものではないことに気づくだろうと考えています。たとえば、関係する幾何学的ディープラーニングは、近年人気の研究方向です。

しかし、材料科学の観点から見ると、安定した材料を探すこのような大規模でハイスループットな探索は、確かにかなりの科学的意義を持っています。

AI for Science 自体は、実際には「科学的発見」に重点を置いており、その大きな意義は科学的発見にあります。

Duan Chenru 氏は、応用の観点から見ると、材料の発見であれ、化学反応の予測であれ、AI を使用して実装を加速する最終的な目的は、依然として「有用」という言葉であると考えています。

今年の NeurIPS AI4Science ワークショップのテーマ「理論から実践へ」と同じです。これは今後 10 年間の AI4Science にとって避けられない道であり、中期的な使命でもあると私は信じています。

OA-ReactDiff の次の目標が適用可能なパスを見つけることであるのと同様に、GNoME は 220 万の安定した材料が適用の出発点にすぎないことを発見しました。化学と材料を特定の業界で真に「輝かせる」ためには、多くの標準 (熱伝導率、電気伝導率など) が必要です。

<<: GPT-4V でさえ解明できない未来推論の解決策があります!華中科技大学と上海理工大学出身

>>:

速度が1000倍になりました！拡散モデルは物質の錬金術プロセスを予測し、システムが複雑になればなるほど加速が大きくなる

拡散モデルを使用して化学反応を予測するにはどうすればよいですか?

燃料薬の設計に役立てることができる

AIが生産性と賃金に与える影響

人工知能が都市の健康に革命をもたらす方法

ハードコア冬季オリンピック！上海交通大学が開発した、障害物を回避したり方向転換したりできるスキーロボットがオンラインになった。

2019 年にトップ CIO が AI を導入する 5 つの方法

ジェネレーティブ AI がサプライチェーンと調達の役割をどのように変革しているか

第14次5カ年計画期間中、我が国のドローン産業の発展はますます明確になりました

ディープラーニング時代の物体検出アルゴリズムのレビュー

モデルの一般化にはSGDに匹敵するフルバッチGDのランダムトレーニングは必要ない、ネットユーザー：計算コストは手頃ではない

快手科技のY-tech AI Labが「2019 CCF科学技術賞」を受賞

推薦する

2.7B は Llama 2 70B に勝てる、Microsoft は「小さな言語モデル」を提供! 96台のA100が14日間でPhi-2を訓練し、Google Gemini nanoを圧倒

AI が生活に統合されると、能力が高ければ高いほど、管理が難しくなります。

GPT-3を超えて、DeepMindは新しいお気に入りのGatoをリリースしましたが、「スープは変えても薬は変えない」と疑問視されています

ビッグデータ、人工知能、そして法曹界の未来

人材管理を改善する人工知能の可能性

人工知能が電力網の未来の鍵となる理由

AIが書いたコンテンツは判別が難しく、言語の専門家でさえ無力である

AMiner が発表: 2022 年に世界で最も影響力のある人工知能学者「AI 2000」

トランプの「猫と犬バージョン」を生成、偽顔ツールStarGANv2が壊れており、アルゴリズムがオープンソース化されている

マスク氏の「脳変革計画」ではどのスキルツリーを活性化する必要があるのか？