エジソンが何千もの材料をフィラメントとして試し、試行錯誤を繰り返し、決して諦めない精神でようやく日常的に使える白熱電球を開発したという話は、誰もが子供の頃から聞いたことがあるでしょう。天才とは、1 パーセントのひらめきと 99 パーセントの努力で決まるのです。 しかし、科学の進歩と現代社会の発展に伴い、新素材の研究開発はますます複雑になってきました。今日、研究者は、電池、半導体、触媒、合金などの分野で使用するための新しい材料を見つけるために、数百万サイズの材料空間で数十の異なる特性を同時に最適化する必要があることがよくあります。エジソンが 99% の汗を必要としたなら、現在の研究者は 99.99% の汗を必要とするかもしれません。 新素材の研究開発プロセスは、人々が「浜辺」で「貝殻」を拾うのと少し似ています。「浜辺」の表面で簡単に見つかる貝殻は、みんなの絶え間ない探索により、ほとんど拾い上げられていますが、より美しい「貝殻」は、より深い「浜辺」の下にまだ埋もれています。これらの「殻」は従来の方法では発見が難しいかもしれませんが、AI for Science (略して AI4S) によって新たな可能性がもたらされました。 マサチューセッツ工科大学 (MIT) の Microsoft Azure Quantum 研究科学者である Chenru Duan 博士は、光吸収クラスターの研究開発において「エジソンのような問題」に遭遇しました。それは、長波可視光を吸収し、安定した励起状態を持つ遷移金属光吸収クラスターを見つけることでした。現段階で光吸収クラスターを発見するには、2 つの大きな困難があります。まず、設計空間には 3,000 万個の分子があり、これはエジソンの時代よりもはるかに大きいです。さらに、長波可視光吸収と安定した励起状態は、化学的にはほとんど相互に排他的な 2 つの特性であるため、探索の難易度が増します。 ドゥアン博士はまず「エジソン式」のランダムサンプリング法を用いて2000個の分子を試し、そのいずれも両方の特性を満たさないことを発見した。同様の探査を継続しても、期待できるものは限られています。そこで、ドゥアン博士はAI4Sの観点からこの問題を再検討し、これら2000個の分子のデータに基づいて機械学習モデルを確立し、分子の吸収波長と励起状態の持続時間を迅速に予測しました。同時に、能動学習とベイズ最適化を使用して、この巨大な物質空間の探索を導きました。新しい探索方法では、探索プロセスが進むにつれて、モデルがターゲット分子を見つける確率が急速に増加します。 500 分子に達すると、試した 5 分子ごとに、長波可視光を吸収し、励起状態の時間が長い遷移金属光吸収クラスターが見つかります。控えめな見積もりによると、この方法の改善により、約 1,000 倍の加速が実現し、これは当初の 3 年間の研究開発サイクルを 1 日に短縮することに相当します。 Duan 博士の研究は最近、JACS Au の表紙記事として出版されました。 論文リンク: Duan et al., https://doi.org/10.1021/jacsau.2c00547 AIが急速に発展する時代。個人として、私たちはこれらのテクノロジーを自分の専門知識とどのように組み合わせるべきでしょうか? AI4S の研究は現在どの段階にありますか? AI4Sの展望は? 「AI+化学・材料」分野を専門とする研究者、賈昊軍博士と段晨如博士がAI4Sについてどう考えているかを見てみましょう。そして、2人がAI4Sの分野で関連する探索的研究を行っています。 賈浩君(左)と段晨如(右) ScienceAI: 自己紹介をお願いできますか? Chenru Duan:私は現在、Microsoft Azure Quantum で研究科学者として働いており、化学における生成 AI と大規模モデルの応用、および Microsoft AI4S 研究の製品化に重点を置いています。彼は2年前にMITで化学の博士号を取得しました。博士課程では主にAI4Chemistryの研究を行い、AI意思決定モデルをハイスループットコンピューティングに統合する先駆者となり、AI+コンピューティングが化学と材料の発見にさらに貢献できるようにしました。仕事以外では、機械学習カンファレンスでAI4Sワークショップ( https://ai4sciencecommunity.github.io/neurips23.html )シリーズの開催に携わり、コミュニティの発展を促進しています。 Jia Haojun:私は現在、MIT 化学・化学工学科で博士課程 5 年目に在籍しています。博士課程では、AI 支援化学設計の第一人者である Heather Kulik 氏の指導を受けました。私の主な研究方向は、ハイスループット量子化学と人工知能を組み合わせて、カーボン ニュートラルのための新しい触媒材料の発見を支援することです。私は以前、ダウ・ケミカルの中核研究開発部門で研究開発に従事し、AI を使用して触媒配合を開発し、化学反応の経路を予測する作業に取り組んでいました。科学研究に加えて、私はMIT中国学生学者協会(MIT CSSA)の2022~2023年会長も務めました。 ScienceAI: お二人とも物理学科を卒業されたそうですね。学部時代から現在までの科学研究や仕事の経験について教えていただけますか? AIに関わるようになったきっかけは何ですか? 賈昊軍:私は学部で物理学を専攻し、学生時代には主に二次元材料、電池、超伝導体、合金の第一原理計算シミュレーションを中心に幅広い研究を行ってきました。当時はまだPyTorchやTensorFlowが普及していませんでしたが、膨大なデータから素材選別の重要性に気づき、AIとの関わりの基盤が築かれました。その後、米国に来てから、AIアルゴリズムを組み合わせることで、大規模なハイスループットスクリーニングと予測が可能になることを発見しました。以前は、複数のシミュレーションの結果を得るのに何日もかかっていましたが、現在では AI アルゴリズムと組み合わせることで、何百万もの材料のハイスループットスクリーニングと予測を実行できます。私が科学研究の世界に入ってからわずか 10 年で、計算シミュレーションは単なる検証実験ではなく、産業界で実際に応用されるようになりました。 AI4S パラダイムは実際に起こっているものであり、大きな市場の可能性を秘めています。 私が化学に転向した理由は、物理学が現実と少しかけ離れていることに気づいたからです。当時の私の学術研究における主な目標の 1 つは、「本棚や店舗の棚に並べられるような成果を生み出すこと」でした。私はもっと実践的なことをしたかったので、ジョンズ・ホプキンス大学の化学科で学部時代を過ごし、気相表面化学に関する実験研究を行いました。実は、化学に触れるのは初めてだったのですが、面白いことをたくさん発見しました。たとえば、物理学は主に現象そのもの、つまり宇宙そのものの法則に関係しています。化学は、人工的に制御できるプロセスと変化に重点を置いています。この中に、本当に価値のあるものが見つかります。これが私が物理学から化学に転向した理由でもあります。 Duan Chenru:私の経験はHaojunさんと非常に似ています。私は学部時代に理論的な凝縮物質研究を行い、量子相転移などの興味深い現象を研究しました。これらの研究分野は魅力的ではありますが、実用化にはまだ程遠い状況です。その過程で、私は、世界の根底にある物理法則を探求するよりも、物理法則を使って世界を変えることの方が楽しいことに徐々に気づきました。そのため、博士号取得を目指していたとき、私はより応用的な方向に進みたいと考えていました。 MITに来てから、たくさんの先生と話をしました。メンターと話をしていたとき、とても興味を引かれた点が1つありました。グループの学生の論文から生成されたデータの量は、彼女がMITに来る前の8年間で行った研究の総量よりも多いと彼女は言っていました。これにより、2017 年に計算化学の分野がいかに急速に発展しているかを実感しました。 私は自分の研究に関連するいくつかの論文を読み始めましたが、計算化学の計算能力とスループットは向上しているものの、計算パイプライン全体、つまりさまざまな計算を統合する方法がまだ十分に開発されていないことがわかりました。したがって、AI を高スループット コンピューティング システムに統合し、より優れたワークフローを構築することが、学術界の成長ポイントになると思います。 2017年に、私はMITで博士課程のキャリアをスタートしました。当時は AI4S という概念は存在していませんでしたが、私はすでに、ハイスループットコンピューティングと人工知能の組み合わせが持つ大きな可能性と、それがさまざまな分野にパラダイムシフトをもたらす可能性があることに気づいていました。そこで私は、この分野をしっかりと選び、物理学から化学と工学の応用へと転向しました。 ScienceAI: 両博士は現在、「AI+化学/材料」コンピューティング分野の研究に注力しています。AI が計算化学にどのように役立つか教えてください。 賈浩軍:量子化学は、第一原理計算による物質特性のシミュレーションです。具体的な考え方は、まず原子の位置を固定してシュレーディンガー方程式を解き、物質の電子構造を求め、次に電子構造に基づいて電子エネルギー、機械的特性、構造特性などの物質特性を求めるというものです。シュレーディンガー方程式を解くための最初のステップは、膨大な計算量を必要とする量子多体問題です。その計算量は、シミュレーションされる原子の数に応じて指数関数的に増加します。これは、現在解決するのが最も難しい問題でもあります。これは、第一原理シミュレーションの分野における「ボトルネック」問題であるとさえ言えます。シュレーディンガー方程式は複雑なため、解くのが困難です。しかし、AI技術の発達により、シュレーディンガー方程式の多体問題を「回避」し、元素の固有特性(原子半径、電気陰性度、価電子など)や物質の結合長や結合角度などを通じて物質の特性を直接予測できるようになりました。主なアプローチは 2 つあります。 AIによる電子構造予測による材料特性の取得:この方法の利点は、電子構造から特性への変換が明確であり、ブラックボックスが存在しないという物理的な根拠にあります。しかし、課題は、多数の行列を含み、電子の数によって制限される材料の波動関数を扱うことであり、これによりシミュレーションの規模が制限されます。 AIにとって波動関数を予測することも困難です。考えられるアプローチの 1 つは、物質の電子波動関数を原子基底関数に投影し、AI を使用して投影係数を予測することです。しかし、これにより、基底関数の完全性などの物理的および数学的な問題が発生し、実際のシステムに適用する際に技術的な課題が生じます。 電子構造を考慮せずに AI で材料特性を予測する:この方法の利点は、多体問題を完全に回避し、理論的には大規模なシステムを扱うために使用できることです。ただし、このアプローチは大量のトレーニング データに大きく依存します。対照的に、最初のアプローチは新しい物理的メカニズムの発見に役立つ可能性があります。しかし、2 番目の方法は新材料の探索と設計に広く使用されており、材料の研究開発サイクルが大幅に加速されています。たとえば、ハイスループットコンピューティングと AI を組み合わせて特性を予測すると、興味のある触媒、バッテリー、2 次元材料などを迅速に選別できます。 AI は、原子間の力を予測したり、分子動力学シミュレーションや構造検索を高速化したりするためにも使用でき、材料シミュレーションの規模と精度を向上させることができます。 Duan Chenru: Haojun はすでに、量子化学がいくつかの物質の特性を計算するのにどのように役立つかについて多くのことを話しました。しかし、実際には問題があります。非常に多くの量子化学手法には何らかの近似が含まれており、異なる近似を選択すると異なる結果が得られます。では、AI を活用して、非常に多くの計算方法の中から「最も適切な」ものを選択するにはどうすればよいでしょうか?あるいは、複数の「近似結果」を使用して「より正確な結果」を得るにはどうすればよいでしょうか?最近、Tik Tokの「ユーザー-ショートビデオ」マッチングロジックに触発されて、「化学物質-計算方法」マッチングをやろうと思いました。 「密度汎関数レコメンダー」を構築することで、金属有機錯体の高スループット計算の精度を初めて実験測定の誤差精度に近づけることができました。この記事は、Nature の主要子会社ジャーナルである Nature Computational Science にも掲載され、Nature News Review でも注目を集めました。 AI 意思決定モデルを計算プロセスに統合するというこれらのアイデアは、計算結果と実験結果のギャップを「埋める」鍵になると思います。 論文リンク: https://www.nature.com/articles/s43588-022-00384-0 ScienceAI: 化学/材料研究の伝統的な方法は何ですか?より成熟した方法論、材料データベース、プラットフォームはありますか? 賈浩軍:伝統的な材料研究の方法は、エジソンのフィラメント実験のように、要素を一つずつ交換するなど、試行錯誤です。かつて非常に人気があった超伝導体を例に挙げてみましょう。La-Ba-Cu-O 超伝導体は最も初期の銅系超伝導体であり、ノーベル物理学賞を受賞しました。しかし、この超伝導体は 35 K でしか超伝導しません。これは液体窒素の温度よりも低い温度です。しかし、La が Y に置き換えられて以来、Y-Ba-Cu-O 超伝導体の超伝導温度は液体窒素の温度よりも高くなり、銅系超伝導体が広く引用されるようになりました。伝統的な研究方法は、昔の「手工芸工房」と非常に似ており、材料の研究開発サイクルは非常に長く、消費される人力と材料資源は膨大で、ある程度のランダム性があります。 コンピュータ技術と量子力学理論の発展により、密度汎関数理論に基づく材料予測方法が成熟してきました。構造検索アルゴリズムとハイスループットコンピューティングを組み合わせることで、候補材料をより効率的にスクリーニングし、試行錯誤のコストを節約できます。計算の観点から見ると、さまざまな元素の組み合わせと 230 の空間群により、材料の位相空間が非常に大きくなります。第一原理計算を変更することなく、材料の事前スクリーニングを行うアルゴリズムは、CALYPSO、USPEX、AIRSS など、比較的成熟しています。近年の超伝導材料の研究が活発化しているのは、水素系超伝導体の発見によるものです。H3S は 150 GPa で 203 K の超伝導転移温度を示します。しかし、この重要な発見は、遺伝的アルゴリズムによって導かれた高圧実験を通じて得られたものです。さらに、データベースと組み合わせた元素置換と密度汎関数計算も効果的な方法です。有名なデータベースには、マテリアル プロジェクト、マテリアル クラウドなどがあります。しかし、従来の方法は依然として多体問題によって制限されており、計算コストも依然として高価です。AIの出現により、この問題を解決する可能性のある方法が提供され、多体問題が根本的に解決され、材料研究がより効率的になります。 Duan Chenru:私たちの科学的探究の方法は、現在でも試行錯誤が中心です。新たな発見の波をもたらすのは、多くの場合、偶然かつ制御できない要因です。実際、AI4S 全体の中核は科学的発見の体系化にあります。たとえば、大量のデータを生成すると、そのデータを使用して AI モデルを構築し、ランダムではなくよりターゲットを絞った方法でこの領域を探索できます。また、空間全体をスクリーニングする代わりに、生成 AI を使用して新しい分子や材料を生成することもできます。これらの方法論的変化は、最終的にはパラダイムシフトをもたらし、科学研究全体をより体系的かつ一般的なものにするでしょう。これにより、より多くの人がより低い障壁で科学研究に参加できるようになり、科学的発見の反復が加速され、科学研究成果の変換率が向上します。 ScienceAI: AI4S は科学の発展における「驚き」(偶発性)の数を減らすでしょうか? 段晨如: 「予想外のサプライズ」はますます少なくなり、「予想通りのサプライズ」はますます増える傾向にあります。全体的には、「喜びが心配を上回っています。」あらゆる最適化において、行動パターンは 2 つのカテゴリに分けられます。1 つは、既存の事前知識を使用して次の選択を行うことです。例えば、Haojun 氏は超伝導体における同じファミリーの元素の置換について言及しました。 2つ目は、LK-99の試みのように、これまで探索されたことのない新しい物質系を積極的に探索することです。これは実はレストランで食べ物を注文するときと非常によく似ています。事前の知識は、私たちが食べた料理に対する評価や印象のようなもので、積極的な探索は、私たちが時々気まぐれで店の新製品の推奨を注文するときのようなものです。 最適化理論では、ベイズ最適化について、探索のメリットを最大化するためにこれら 2 つの補完的な動作のバランスをとる方法について多くの議論が行われています。 AI4S は、継続的な改善と科学研究ツール ライブラリ内のツールを通じてこれらのバランスを実際に調整し、最終的な科学研究の成果または利益を最大化します。冒頭で紹介した「長波可視光を吸収し、安定した励起状態を持つ遷移金属吸収クラスターの探索」という作業は、その典型的な例です。これは、レストランで試行錯誤しながら 100 種類の料理を試食し、どれも高価でまずい料理ばかりだったのと同じです。このレストランをブラックリストに追加しようとしているときに、AI4S の最適化手法によって、このレストランで安くておいしい料理を正確に注文できることがわかります。 さらに、生成 AI と拡散生成モデルの発展により、当社の科学研究ツール ライブラリは積極的に驚きを生み出す可能性さえ持っています。これまでの研究では、いずれも大規模な素材ライブラリから素材を選別してきましたが、これは実際には自分の想像力を制限することに相当します。生成されたマテリアルが元のマテリアル ライブラリに存在しない可能性があるため、生成 AI によって「予期しない驚き」がもたらされることがあります。これは、レストランの料理がまずくても、AI を使って新しいメニューを生成できるようなものです。これらのモデルは、エネルギー安定性分子の生成や、タンパク質やターゲットに対する小分子薬の生成など、実際に多くの科学的研究に適用されています。 最近、私たちは、生成 AI が単一の構造を生成するだけでなく、化学研究の核心である新しい化学反応を直接生成できるようにするプロジェクトに取り組みました。この手法は、統計理論によって裏付けられた原理に基づいているものの、応用レベルでは、古代の錬金術のように、まったく未知の化学反応を直接探究し、統計分布に従う「予期せぬ驚き」を生み出すことができるため、私たちは冗談めかしてこの手法を現代の「AI 錬金術」と呼んでいます。 ScienceAI:ChatGPTは世界中で人気を博し、基礎科学研究分野でも「ChatGPTのような」プロジェクトが数多く生まれています。現在、科学研究分野における大規模モデル研究はどのような段階にあるとお考えですか? 「科学研究チャットGPT」は将来どのようになるのでしょうか? Duan Chenru: 「赤ちゃんのための量子物理学」という非常に人気のある本がありました。現在のステータスは「赤ちゃんのための科学GPT」だと思います。主な理由は、ChatGPTが2022年末にリリースされ、時間がまだ短いことです。誰もが習慣的に考えていることは、GPTを元の問題に直接適用する方法にまだ固執しています。その結果、Science における現在の研究のほとんどは、GPT の単純な直接適用か、微調整です。しかし、この段階はすぐに過ぎ去ります。 GPT 自体の真の可能性は、人々が機械と対話する方法、そして異なる機械同士が対話する方法を変えることです。たとえば、機械学習に取り組む前に、Python の書き方を知る必要がありました。今では、コーディング作業の多くを GPT に引き渡すことができます。あるいは、ロボットを作るには、チップが古いので、VB のような「古いコード」の書き方を学ぶ必要があるかもしれません。今では、おそらく自然言語のみを使用してこのやり取りを行うことができます。 今後は、GPT を核として複雑な研究開発プロセスをつなげていく方向性を探っていく価値があると思います。また、工業生産チェーンでは、自然言語インターフェースとして使用されており、さまざまな複雑なソフトウェア、他のプログラミング言語、さまざまな機器を学習する際の障壁を減らすことができます。他の2つの興味深い方向性は次のとおりです。(1)分子または材料分野でGPT事前トレーニング方法を使用して大規模な材料モデルまたは大規模な化学モデルを作成し、化学材料分野で実験データを取得するための高コストの問題を軽減または緩和できますか? (2)これまでのスクリーニングからGPTのような手法を使って新しい材料を生成するというように、材料設計に対する考え方を変えることはできるだろうか?これら 2 つの方向での探索は、GPT を直接適用するよりもエキサイティングなものになると思います。 賈昊軍:少し付け加えさせてください。まず、GPT は大規模な言語モデルです。ChatGPT を頻繁に使用すると、その精度が比較的低いことがわかります。しかし、科学的問題、特に化学物質などの定量的な問題では、精度が非常に重視されます。 2 番目の問題は、現時点では、大規模な言語モデルでは人間の認知の限界を超えるコンテンツを生成することが難しいことです。しかし、一般的に言えば、科学研究を行う際には、人間の認知の限界を広げ、新しい現象を発見し、新しい理論を確立したいと考えています。 3 つ目の問題は、材料、化学、物理学など、特定の垂直分野で大規模な言語モデルを作成する場合、見つけられる論文や公開データベースはすべて、一般的にすでに作成されたものであり、成功したケースのみであるため、トレーニング セットに大きな偏差が生じてしまうことです。しかし、今後は科学研究、学術、産業を問わず、さまざまな分野で縦型の大型モデルが必ず登場すると思います。 ScienceAI: 現在の大手テクノロジー企業は、AI4Sに関してどのような考えや行動を取っているのでしょうか?伝統的な素材化学品製造大手はAI4Sについてどう考えているのでしょうか? 賈昊軍: DeepMind の初期の AlphaFold は、AI4S の輪から抜け出した製品と言えます。海外のテクノロジー大手はAI4Sに多額の資金を投資している。マイクロソフトは2022年にAI4S研究所を設立し、MetaはOpen CatalystsとESMFold、Nvidiaは最近BioNeMoを設立した。中国では、バイトダンスはすでにAI4S部門を擁しており、Deepinなどの専用プラットフォームのスタートアップも存在している。 AI4Sは多くのことが可能であり、資本にも好まれています。 2か月以上前、MetaはESMFoldチーム全体を解散しましたが、チームの中核メンバー8人は2週間後にさらに4,000万ドルの資金を調達し、そのモデルの適用を開始しました。大企業の論理は、独自のコンピューティング能力とクラウド サービスに基づくプラットフォームを構築し、AI4S のより成熟した方法を製品化し、ToB または ToC サービスの形ですべての人に提供することを目指しています。 この観点から見ると、伝統的な化学大手企業は、実際にはこれらの大手テクノロジー・プラットフォームのユーザーです。例えば、マイクロソフトの最新製品では Azure Quantum Elements ( https://quantum.microsoft.com/en-us/our-story/quantum-elements-overview )は、BASF、AspenTech、Johnson Matthey など、多くの化学、化学、素材の大手企業から支持を得ています。しかし同時に、これらの化学材料工場には独自のデジタルイノベーションチームと AI4S 研究も存在します。しかし、歴史的発展の道筋が異なるため、化学材料工場の固定利益モデルは、材料パラダイムを当初の実験から AI 指向に移行させるのに適していません。 現在、大手テクノロジー企業と伝統的な化学材料製造大手はともに AI4S に非常に興味を持っており、多額の資金を投資しています。しかし、両者の間にはまだ一定の知識のギャップがあり、調整して合意に達するには多くの時間が必要です。 Duan Chenru: Haojun氏は主にビッグテックの観点から話をしましたが、私は伝統的な材料化学製造の観点からお話ししたいと思います。例えば、BASF、DOW、3M などの伝統的な材料化学製造大手は、AI 技術を既存の工業生産技術に統合するために懸命に取り組んでいます。フロントエンドの材料研究開発業界から、生産反応条件のミッドストリーム最適化まで。現在では一般的に「デジタルイノベーション」と呼ばれており、業界内ではこれに対するコンセンサスが形成されています。具体的な投資について言えば、ダウ・ケミカルのデジタルイノベーションへの社内投資は昨年4億ドル、今年は5億7000万ドルで、来年はさらに増加する予定です。さらに、もう一つのより重要な対外目標である2050年カーボンニュートラル目標に向けては、特に目標の初期段階において、既存の生産プロセスにおける原材料の利用と生産効率を最適化し、改善することが極めて重要です。 テクノロジー大手と伝統的な製造大手はどちらも AI4S に関して実際に合意に達していますが、出発点は異なります。これはトップダウンとボトムアップの違いのようなものです。たとえば、Microsoft や Google はこの業界では伝統的な企業ではないため、トップダウンの視点から始めて、より高い視点から問題を解決するためのモデルをいくつか提案することを好みます。これらの伝統的な産業では、まず材料の配合や反応条件など、既存のものを最適化し、ボトムアップで作業を進める場合があります。従来の産業では、独自の研究開発の道筋と巨大な産業構造により AI 変革のペースが遅くなり、大きな船を方向転換することが困難になるため、大規模に AI4S の観点から物事を進めることは困難です。 ScienceAI: AI が企業の科学研究に力を与えるという点では、AI による医薬品製造が最も大きな割合を占めているようですね? 「AI+化学・材料」産業の実現はより困難か? 賈昊軍:個人的には、現時点ではAI+化学・材料は実装の面で比較的簡単だと感じています。実際、卒業生の多くは大手製薬会社に就職しており、ケンブリッジはバイオメディカルの中心地です。実は私も最初は製薬業界で働くことを考えていたのですが、なぜそうしなかったのでしょうか。 まず、新しい薬剤化合物が最初の発見から市場に投入されるまでには約 15 年かかります。ここでの最大の時間的ボトルネックは、薬物分子を見つけるプロセスではなく、臨床試験の時間です。しかし、材料/化学の発見においては、後にエンジニアリングのスケールアップが進むものの、現時点での中心的なボトルネックとなっているのは、依然として適切な材料や適切な配合を見つけることです。 さらに、スクリーニングの技術的な観点からは、大規模なターゲットデータセットを小さなデータセットに縮小することが中心的な目標です。小分子相互作用であれ、タンパク質間相互作用であれ、適切な特定の標的薬が見つかったとしても、人体の複雑な環境で他の化学反応が起こらないようにすることは困難です。薬物送達自体が非常に難しい問題です。 最後に、材料については、実験室で小規模テスト、中規模テスト、大規模テストを実施することで、使用可能かどうかを判断できます。したがって、この観点から見ると、材料は製造が容易になり、業界の問題点をより適切に解決できるようになります。 段晨如:これは具体的な状況と産業チェーンとの組み合わせが必要だと思います。産業の観点から見ると、AI+化学/材料の優位性は、産業の生産拡大能力が比較的成熟し、標準化されており、特に国内の化学産業の生産拡大能力は実際に非常に強いことです。私たちの主なボトルネックは、まず第一に、より優れた触媒材料をいかに発見するかということです。化学材料の分野では、現在、初期のイノベーションがより困難な部分ですが、医薬品の分野では実際のところ、最終的な臨床試験と FDA の承認がより困難であるため、少し逆になっています。したがって、論理的に言えば、AI4S を化学材料に適用して工業化する方が合理的であると言えます。 ScienceAI: 「基礎科学研究」から「産業実装」への移行は、常に難しい問題であるように思われます。AI の助けを借りて、産業実装をより加速するにはどうすればよいでしょうか? Duan Chenru:実装は確かに非常に難しい問題です。なぜなら、単一モデルの絶対的なリーダーシップは、「産業実装」の十分条件でも必要条件でもないからです。 AI4S 分野における最も代表的な研究の 1 つとして、AlphaFold はいくつかの医薬品開発プロセスに徐々に応用されてきました。最近、AlphaFold は非常に優れたタンパク質構造を生成できるものの、ドッキング (つまり、タンパク質と低分子薬剤の結合構造) を予測するには不十分であることを発見しました。多くの人は、この結果を予想外だと感じますが、これはごく普通のことだと思います。なぜなら、AlphaFold の設計時にはドッキングは考慮されていなかったからです。科学研究で私たちが遭遇する問題は、第一に単純化された問題であり、第二に局所的な問題です。問題を単純化するということは、問題を単純化して近似値を求めることを意味します。ローカルな問題とは、非常に長い産業チェーンの一部を取り出して、その問題に取り組むことを意味します。この場合、モデルの精度が 100% であっても、「近似的かつ一方的」であるため、「実装」することはできません。 したがって、「実装」の難しさは、むしろ産業シナリオの理解と統合にあると思います。たとえば、AI の観点からこれらのモデルを業界に適用し、継続的にテストと反復を行い、業界内でより優れたワークフローを形成して、問題を効果的に解決するにはどうすればよいか。これは、AIを使用して特定の問題を解決するために、より発達的な観点から問題を検討しています。つまり、AIモデルと問題自体の両方を同時に改善するために、既存のワークフローを引き続き改善する必要があります。特に現在のオープンソースのコンテキストでは、単一のモデルをリードすることは非常に大きな障壁を提供することはできません。 ChatGptが最初に出てきたとき、それは他のすべての大きなモデルを上回りました。しかし、1年後、オープンソース環境の継続的なプロモーションにより、すべての人とChatGPTのギャップはますます小さくなりました。したがって、「実装」の観点からは、単一のモデルの精度を追求するだけでなく、実際の問題に基づいて効果的なワークフローを開発し、さまざまなモデルを直列に接続し、業界と密接に統合し、継続的に反復する方法を検討する必要があると思います。 Jia Haojun: 「基本的な科学研究」から「産業実施」への移行は、常に複雑な課題でした。まず第一に、基本的な科学研究の目標は、産業用アプリケーションのソリューションを直接提供することではないことを明確にする必要があります。たとえば、技術開発の規模では、成熟した産業はレベル100である可能性がありますが、基本的な科学的研究は0から1または0から0.1までのプロセスです。このタイプの研究は通常、学校や研究機関で行われますが、すべてのプロジェクトが成功しているわけではなく、すべての研究の方向性がすぐに産業用途につながるわけではありません。 しかし、これはすべての基本的な科学的成果を産業用途に変えることができないことを意味するものではありません。なぜなら、大学や研究機関では、ほとんどの研究は0から0.1または0までのプロセスであるが、特定の成果が成功すると、特定の業界に大きな影響を与える可能性があるからです。この状況は、中国と米国の間の産業開発のさまざまな段階によって国内で影響を受ける可能性があります。米国では、0.1から100までの多くの開発が新興企業によって推進されていますが、「業界と大学の研究」モデルも中国で徐々に発展しています。 Duan Chenru:私の考えでは、科学者の理想は2つのことをすることです。 1つ目は、物質的な世界を理解することです。これは、より基本的な主題(物理学、化学など)が行うことです。 2つ目は、世界を変えることです。 AI4は両方を持つことができます。基本的な法律(つまり、AIの科学)を発見するだけでなく、より適用される側面でも使用できます。 Scienceai:AI4Sの新しい科学研究パラダイムの下で、伝統的な化学/材料の分野の研究者は、元の快適ゾーンから学際的な研究に移行する過程でどのような困難を抱えていますか?学際的な研究に参加することを計画しているジュニアについて、どのようなアドバイスがありますか? Jia Hajun:誰もがすべての取引のジャックになることは不可能です。より広い観点から、私たちは通常、何かをすることができるかどうかを測定するために3つの次元のみを検討します。まず第一に、あなたはこれを行う能力がありますか?変化するメジャーを例にとると、人文科学から物理学や化学に切り替えたい場合は、短期間で多くの新しい知識を学び、高い圧力に直面する必要があります。 2番目の次元は、このことに興味があるかどうかです。博士号のために勉強することに関しては、少なくとも5年間それをサポートするのに十分な関心がありますか? 3番目の次元は、このことが将来の見通しを持っているかどうかです。したがって、私たちが追求しているのは、これらの3つのことの交差点であり、これらの3つの次元から個別に考えることができます。 Duan Chenru: AI4Sは、誰もが両方の科学で同等に優れており、5:5の比率を達成する必要があるわけではありません。 5:5レベルに達したとしても、考えずに十分な実践的な経験をせずに重要な成果を達成することは依然として困難です。個人的には、理想的な比率は3:7または2:8だと思います。 AI4Sエコシステムは非常にオープンで、誰もが使用できる多くのオープンソースコードライブラリとオープンソースツールがあり、さまざまなアイデアの衝突も促進します。重要なのは、誰もが本当に得意な領域を持っている必要があり、実際にコミュニケーションをとるためにイニシアチブをとることです。たとえば、前述の生成AIを使用した化学反応に関する研究は、拡散モデルの経験があるコンピューティング同僚の助けを借りてコラボレーションの結果でした。 従来の化学研究者として、コンピューター部門のパートナーとコミュニケーションをとるときに、お互いの言語を理解できるようにするには、AI関連の知識を学ぶのに十分な時間を費やす必要があります。これが、AI4Sワークショップを整理し続ける理由でもあります。さまざまな分野の人々が自分のアイデアについて話し合い、AI4Sコミュニティを強化する機会があるように、コミュニケーションのためのプラットフォームを提供するためです。 |
<<: OpenAIがついにオープン:DALL-E 3の論文が発表され、ChatGPTが開始、著者の半数が中国人
この記事では、まず RAG の概念と理論に焦点を当てます。次に、オーケストレーション用の LangC...
強化学習 (RL) とディープラーニングの組み合わせは、一連の印象的な結果をもたらし、(ディープ) ...
[[422303]]人工知能(AI)は、かなり長い間、世界中のビジネスにおいて安定した存在となってい...
最近、クライアントの開発チームと SQL Server データ マイニングとそのアプリケーションにつ...
過去数か月間、数学者のテレンス・タオ氏は、ChatGPT を使用して数学の問題を解くのに何度も試み、...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
スケンダーさん、あなたの発明の本質から始めましょう。 SIZEアルゴリズム開発とは何ですか?このアル...
人工知能ソリューションの市場は急速に成長を続けており、数百億ドルの収益をもたらしています。調査会社I...
Rsync は、Unix/Linux でファイルを同期するための効率的なアルゴリズムです。2 台のコ...
現在の国際情勢から判断すると、将来の軍事兵器の開発は主に宇宙に向けられることになるが、スペースシャト...
[[405132]]序文キュー ライブラリは、マルチスレッド プログラミングに適した先入れ先出し (...
6月16日、MetaのCEOマーク・ザッカーバーグ氏とその代理人は、Metaが開発中の新しい人工知...