テレンス・タオ氏は、ChatGPT が数学的証明を覆すだろうと常に楽観的でしたが、現在、化学分野における AI の可能性も同様に計り知れません。 現在、220 万の結晶構造が AI によって完全に予測されています。 コンセプトは何ですか?それは約800年分の知識に相当します。 Google DeepMindは、新素材の安定性を予測し、発見のスピードと効率を大幅に向上できる新しいAIツール「GNoME」を開発した。この論文は本日Nature誌に掲載された。 論文リンク: https://www.nature.com/articles/s41586-023-06735-9 220 万の結晶予測のうち、38 万は最も安定した特性を持ち、超伝導体、電気自動車のバッテリー研究開発、スーパーコンピューターの電源などの分野に動力を与える将来の変革技術の材料となる可能性を秘めています。 さらに、世界中の科学者たちは、GNoME の助けを借りて、AI によって発見された新しい材料を合成し始めています。 米国のローレンス国立研究所と DeepMind は協力して、自律的な材料合成に GNoME の予測をどのように使用するかを示す別の論文を Nature に発表しました。 17 日間で 41 個の新物質が独立して合成されました。 論文リンク: https://www.nature.com/articles/s41586-023-06734-w AIによる基礎科学の推進は、今後人類の文明を急速に発展させるかもしれません! OpenAI が AGI への道を歩む人類のナビゲーターであるならば、DeepMind は人類が科学の分野で自らの限界を継続的に突破するのを助ける剣です。 AIを活用した材料発見の加速これまで、科学者たちは既知の結晶を微調整したり、新しい元素の組み合わせを試したりして、新しい結晶構造を探してきました。 これは、試行錯誤を繰り返す、費用と時間のかかるプロセスです。限られた結果を得るには通常数か月かかります。 過去10年間で、世界中の科学者はコンピューターシミュレーションを通じて28,000種類の新物質を発見しました。 従来の実験手法を用いて人間が発見した約2万個の安定物質と合わせると、AI支援による物質発見が使われる前に人間が発見した安定結晶の総数は4万8000個に達した。 DeepMindはAI材料発見ツールGNoMEを使用して220万個の新しい結晶を予測し、そのうち38万個は安定した構造を持っていました。 GNoME によって予測された新しい安定構造のうち 736 個は、他の科学者によって独自に発見された安定した物質と一致しており、新しく発見された物質が客観的に現実のものであることを示しています。 それ以来、人類が発見した安定した結晶の数は、約 9 倍に増加しました。 これらの材料の中には、グラフェンに似た新しい層状化合物が 52,000 個あり、そのうち 1,000 個は以前の研究で発見されています。 これらの材料の中に、より強い超伝導特性を持つ材料が見つかれば、電子機器に完全な革命が起こる可能性があります。 科学者たちは GNoME を使用して、これまでの研究結果の 25 倍にあたる 528 個の潜在的なリチウムイオン伝導体も発見しました。 これらの材料は、バッテリーの性能を向上させ、人類のエネルギー構造を変えるために使用できる可能性があります。 DeepMind は今後、これら 38 万個の安定した物質の予測構造を公開する予定です。 GNN を使用した材料探索GNoME は、安定したマテリアルを検出するために 2 つのワークフロー (パイプライン) を使用します。 構造パイプラインは既知の結晶構造に類似した候補を作成しますが、組成パイプラインは化学式に基づいてよりランダムなアプローチを採用します。 次に、密度汎関数理論の計算を使用して両方のワークフローの出力を評価し、その結果を GNoME データベースに追加して、次のアクティブ ラーニング ラウンドに通知します。 GNoME は、結晶の総エネルギーを予測できる最先端のグラフ ニューラル ネットワーク (GNN) モデルです。 GNN の入力データはグラフ形式であり、原子間の接続に非常に似ているため、GNN は新しい結晶材料の発見に特に適しています。 モデルへの入力は、要素の単一の埋め込みを通じてグラフに変換されます。メッセージ パッシング定式化が採用されており、集約投影は非線形特性を持つ浅い多層パーセプトロン (MLP) です。 構造モデルの場合、データセット全体にわたる原子の平均隣接性によってエッジからノードまでの情報を正規化することが重要です。 GNoME の初期モデルは 2018 年の Materials Project (約 69,000 の材料) でトレーニングされ、研究者らは以前の研究でこのタスク用に設定された平均絶対誤差 (MAE) を改善しました。 GNoME は、Materials Project を通じて公開されている結晶構造とその安定性に関するデータを使用してトレーニングされます。 研究者らは GNoME を使用して新しい候補結晶を生成し、その安定性を予測しました。 トレーニングサイクル中のモデルの予測力を評価するため、研究者らは密度汎関数理論(DFT)と呼ばれる高度な計算手法を使用してモデルの出力を繰り返しチェックしました。 DFT は物理学、化学、材料科学の分野で広く使用されており、原子の構造を理解するのに役立ち、結晶の安定性を評価する上で重要な役割を果たします。 研究者たちは「アクティブラーニング」と呼ばれるトレーニングプロセスを使用して、GNoME のパフォーマンスを大幅に向上させました。 アクティブ ラーニングは、最初に小規模で特殊なデータセットでトレーニングされたモデルをスケーリングする手法です。開発者は、その後、人間の支援を受けてモデルが新しいデータにラベルを付けられるように、新しい目標を導入できます。 GNoME は新しい安定した結晶構造を予測し、それを DFT を使用してテストし、結果として得られる高品質のトレーニング データをモデル トレーニングにフィードバックします。 GNoMEの登場により、材料安定性予測の発見率は約50%から80%に向上しました(以前のSOTAは50%でした)。 さらに、GNoME の効率も大幅に向上し、検出率が 10% 未満から 80% 以上に向上しました。効率の向上により、検出ごとに必要な計算量が大幅に節約されます。 「AIフォーミュラ」新素材GNoME の目的は、新しい材料を発見するコストを削減することです。 この研究を終えた後、研究者らは科学文献を検索し、GNoME の予測と一致する、世界中の研究室で独自に作成された 736 個の新しい材料を発見しました。 これは、GNoME の安定した結晶の予測が客観的な現実と一致していることを証明しています。 上の画像には、アルカリ土類ダイヤモンド光学材料 (中央の列) から潜在的な超伝導体 (右の列) までの 6 つの例が示されています。 DeepMind は、研究コミュニティに新しく発見された結晶のデータベースを公開しました。科学者に新素材の「AI レシピ」を提供することで、DeepMind は科学者が新素材をテストし、最適なレシピを作成できるように支援したいと考えています。 結晶データベースの「AIフォーミュラ」を利用することで、科学者は新しい材料を迅速に開発することができます。 ローレンス・リバモア国立研究所が発表した論文の中で、研究者らはロボット実験室が自動合成技術を通じて新しい材料を迅速に作成できることを実証した。 研究室は、Materials Project (MP) の材料と GNoME の安定性に関する洞察を活用して、結晶構造の新しいレシピを作成し、41 種類を超える新しい材料の合成に成功し、AI 駆動型の材料合成の新たな可能性を切り開きました。 上の図は、58 個の新しい化合物を合成した結果を示しています。矢印はゼロに近い値を示します。 合計 41 個のターゲットが正常に合成された (青いバー) 一方、残りの 17 個のターゲットは失敗した (赤いバー) ことがわかります。 スラッシュの付いたターゲットは、アクティブ ラーニングが使用されたことを示します。各バーの上の散布点は、各ターゲットのレシピを試した結果を表し、実行された順に上から下に配置されています。 挿入された円グラフは、成功したターゲット (左) とレシピ (右) の割合を示しています。 上の図は、実験室で合成できない 17 種類の対象物質を分析したもので、各物質は合成を複雑にする特性に応じて分類されています。 準安定状態を除いて、残りの 16 個の安定ターゲットが直面する課題は、実験上の障害 (青、13) と計算上の障害 (緑、3) の 2 つのカテゴリに分けられます。 これらの障害は、さらに、反応速度の遅さ、揮発性前駆物質、生成物の非晶質化、および 0 K で実行される DFT 計算の制限という 4 つの異なる障害モードに分類できます。 論文の詳細エネルギー的に有利な無機結晶の発見は、固体化学における基本的な科学的、技術的関心事です。 数十年にわたり、実験的手法により、無機結晶構造データベース (ICSD) には、200,000 エントリのうち 20,000 の計算上安定した構造が作成されました。ただし、コスト、スループット、合成の複雑さなどの理由により、この戦略を一般化することはできません。 Materials Project (MP)、Open Quantum Materials Database (OQMD)、AFLOWLIB20、NOMAD21 が提唱する計算方法では、物理エネルギーの近似として密度汎関数理論 (DFT) に基づく第一原理計算を使用します。 研究者らは、第一原理計算と単純な置換を組み合わせることで、独自の再計算により、計算上安定した材料の数を 48,000 に増やしました (方法を参照)。さらなる材料発見に向けたデータ駆動型のアプローチが求められていますが、機械学習技術は、競合する位相エネルギーの凸包に対する安定性(分解エネルギー)の推定において、これまでのところ十分な成果を上げていません。 研究者らは、大規模な能動学習を通じて材料探索における機械学習の利用を拡大し、材料探索を導くために安定性を正確に予測できるモデルを初めて確立しました。 研究者のアプローチは 2 つの柱に基づいています。 まず、新しい対称性を考慮した部分置換 (SAPS) とランダム構造検索を含む、複数の候補構造を生成する方法を確立しました。 第二に、研究者らは最先端のグラフニューラルネットワーク(GNN)を採用し、構造や組成に基づいた材料特性のモデリングを改善しました。 一連のラウンドで、これらの材料探索用グラフ ニューラル ネットワーク (GNoME) は既存のデータでトレーニングされ、候補構造をフィルタリングするために使用されます。 DFT 計算によって選別された候補構造のエネルギーは、モデル予測を検証できるだけでなく、次のアクティブ ラーニング ラウンドでより大きなデータセットに対してより堅牢なモデルをトレーニングするためのデータ フライホイールとしても機能します。 この反復的な手順を通じて、GNoME モデルは、特に計算構造と実験構造の両方を含む集約データセットにおいて、以前の研究と比較して安定した 220 万以上の構造を発見しました。 発見された物質間の安定性をめぐる競争を考慮すると、更新された凸包には 381,000 個の新しいエントリが含まれ、合計 421,000 個の安定した結晶となり、これまでに発見されたすべての結晶と比較して桁違いに増加します。 研究者らは、機械学習の他の分野での観察と一致して、ニューラル ネットワークの予測はデータ量に応じてべき乗法則に従って拡大することを発見しました。 最終的な GNoME モデルは、安定した予測の精度 (ヒット率) を、以前の研究でのわずか 1% と比較して、80% 以上 (構造予測) および 33% 以上 (組成予測のみ) に正確に予測および向上できます。 さらに、これらのネットワークは分布外一般化を開発します。 たとえば、GNoME は、5 つ以上の固有要素 (トレーニング中にこれらの要素を省略したにもかかわらず) を含む構造を正確に予測することができ、この化学空間を効率的に探索するための最初の戦略の 1 つを提供します。 研究者らは、予測を実験およびより忠実度の高い r2SCAN 計算と比較することで、調査結果を検証しました。 最後に、研究者らは、GNoME 検出プロセス中に生成されたデータセットにより、下流のアプリケーションに新しいモデリング機能が実現されることを実証しました。 これらの構造は、これまでにない精度とゼロショットの一般化を備えた学習済みの等価原子間ポテンシャルをトレーニングするための大規模で多様なデータセットを提供します。 研究者らは、分子動力学シミュレーションを通じてイオン伝導率を推定することで、材料特性を予測する上でこれらの可能性が期待できることを実証した。 候補材料の生成とフィルタリング可能性のある材料の空間は、偏りのない方法でサンプリングするには大きすぎます。 候補物質のエネルギーを安価に推定する信頼できるモデルがなければ、研究者は化学的な直感を利用して類似のイオンを代用したりプロトタイプを列挙したりすることで候補物質の生成を制限するしかありません。 この戦略は検索効率を向上させますが、候補物質の多様性を根本的に制限します。 ニューラルネットワークを使用して検索を誘導することで、研究者は候補を生成するためのより多様なアプローチを使用し、効率を犠牲にすることなく結晶空間のより広範な探索を行うことができました。 候補結晶を生成しスクリーニングするために、研究者らは下の図に示すように 2 つのフレームワークを使用しました。 まず、既存の結晶を修正して構造候補を生成します。しかし、研究者らは、イオン置換確率を調整して候補構造に優先順位を付け、新たに提案された対称性を考慮した部分置換(SAPS)を使用して不完全置換を効率的に達成することで、置換セットを大幅に拡大しました。 アクティブ ラーニング中、この拡張により 109 を超える候補構造が生成されます。結果として得られる構造は、ボリューム ベースのテスト時間拡張とディープ アンサンブルによる不確実性の定量化を使用して、GNoME によってフィルター処理されます。 最後に、構造をクラスター化し、多型を DFT で評価するためにランク付けしました。 2 番目のフレームワークでは、構成モデルは構造情報がない場合でも安定性を予測します。入力は削減式です。酸化状態平衡によって生成されるモデルは、多くの場合、制限が厳しすぎます。研究者らは、緩和された制約を使用して、GNoME を使用してコンポーネントをスクリーニングし、ab initio ランダム構造検索 (AIRSS) による評価のために 100 個のランダム構造を初期化しました。 どちらのフレームワークでも、モデルはエネルギー予測を提供し、競合する相に対する相対的な安定性 (解離エネルギー) に基づいてしきい値が選択されます。 評価は、Vienna Ab initio Simulation Package (VASP) で実行された DFT 計算を使用して行われ、研究者らは、発見された安定材料の数と、Materials Project (MP) と比較した予測された安定材料の精度 (ヒット率) の両方を測定しました。 GNoME は、電気自動車のバッテリーからより効率的なコンピューティングのための超伝導体まで、より環境に優しい技術を開発する可能性を秘めた 380,000 個の安定した結晶を発見しました。 DeepMind の GNoME と、バークレー研究所、Google Research、世界中のグループの協力者による研究では、AI を使用して材料の発見、実験、合成を導く可能性が示されています。 GNoME やその他の AI ツールがこの分野に影響を与え、変化をもたらし、私たちの未来を導いてくれることを願っています。 ネットユーザーの間で熱い議論一部のネットユーザーは、GNoME の新しい素材を予測する機能に基づいて、次の画像を生成しました。 かなり鮮明だと言わざるを得ません。 一部のネットユーザーもLK-99を取り出して宣伝した。 「LK-99 を覚えていますか? Google DeepMind の最新の AI ツールである GNoME は、220 万の新しい材料を特定することで新しいベンチマークを設定し、材料科学に対する理解を再定義しました。この発見はこれまでの取り組みを超え、さまざまな用途を持つ新しい結晶カタログを提供します。」 Google の製品が ChatGPT と真っ向から競合するのを期待していたところ、Google が ChatGPT のスキルを他の場所で使用していたことがわかりました。 一部のネットユーザーはこう言った。 「人々がチャットボットに夢中になっている間に、本当の AI は DeepMind にあります。」 もちろん、次のように言う陰謀論者もいます。 「科学者がこのような研究に基づいて秘密裏に何を合成したか想像してみてください。このようなシミュレーションを行っている研究室は DeepMind だけではないはずです。」 |
<<: ChatGPT 1 周年、Altman が OpenAI に復帰!帰国の内幕を明かすイリヤの所在はまだ不明
>>: 新しいNeRF技術は、ビデオを簡単に制御できる3Dモデルに変換できます。
ディープラーニングは、データが大量にある場合、どんなに複雑な問題でも問題ありません。しかし、データが...
先週のバーチャルクロスワードパズル「アメリカンクロスワードパズルトーナメント」には1,000人を超え...
1. 検索セマンティックモデルの現状ERNIE: 知識統合による表現の強化は、中国語の NLP タス...
より強力な AI エージェントを構築するにはどうすればよいでしょうか?答えは、彼らに完全で現実的な世...
ZKの紹介ZK = 動物園の飼育係ZK は、マイクロサービス ソリューションにおけるサービス登録と検...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
[[417154]] [51CTO.com クイック翻訳]あらゆる AI アプリケーションの成功は...
厳選されラベル付けされたデータ セットを使用して AI システムをトレーニングすると、オブジェクト認...
長年にわたり、プログラミングは私の人生における最も重要な喜びの源の 1 つでしたが、この喜びがどれだ...
人工知能は世界的な流行語となり、ほぼすべての企業のデジタル変革計画に不可欠な要素となっています。 A...
1. 金融テクノロジー金融テクノロジー: これは業界ではフィンテックと呼ばれています。 Wikip...