AI4Science はまだ誤った提案なのでしょうか? 2年後、ワークショップ主催者はAI4Scienceを再検討する

2021年、情熱的な若者のグループが、AI4Science（AI for Science）を機械学習のトップカンファレンスであるNeurIPSに導入することを提案しました。

何？ AI4Science は学問分野ですか?世間の注目を集めるためにAIに頼っているのでしょうか?さまざまな疑問が次々と湧いてきました。

こうした疑問や混乱は、第 1 回 AI4Science ワークショップへの一般の参加が比較的低調であったことにも反映されていました。

時代は変わりました。過去2年間で、DeepMindがAlphaFoldをベースとしたIsomorphic Labを設立し、MicrosoftがAI4Science Initiativeを設立し、DeepMindやAISIなどの国内企業や学術機関がAI4Scienceの構築を積極的に推進し、成長と発展を続けています。

2023年8月には、Al4Scienceワークショップの主催者がNature誌にレビュー記事を発表し、過去数年間の科学的発見プロセスにおけるAl4Scienceの進歩をまとめ、将来への道を示しました。

昨年 12 月、NeurIPS、AI4Science ワークショップには 200 件を超える応募と数千人の参加者が集まり、NeurIPS で最大規模のワークショップの 1 つとなりました。これらの数字を見ると、AI4Science が誤った命題だと言う人はもういないようです。

最近、Al4Science ワークショップの主催者がブログを公開しました。 AI4Science を重視すべき理由についてお話しいただきましたか?化学、生物学、コンピューターサイエンス/数学科学、物理学、地球科学、神経科学から医学に至るまでの分野を網羅し、2023年にAI4Scienceが達成した進歩をまとめています。最後に、主催者は2024年のAI4Scienceの発展への期待を表明しました。

ブログアドレス: https://medium.com/@AI_for_Science/ai-for-science-in-2023-a-community-primer-d2c2db37e9a7

AI4Science を重視する理由は何ですか?

AI が複数の分野で活躍するにつれて、別の疑問が生じます。なぜ AI4Science を重視するのでしょうか? AI4Drugs や AI4Materials などのサブ分野で誰もが AI を適用できればもっと良いのではないでしょうか?主催者はいくつかの理由を指摘している。

分野間の相乗効果: AI4Science の誕生は、AI とさまざまな科学分野間の相乗効果を促進するだけでなく、AI と科学のさまざまなサブ分野間の架け橋を構築します。この学際的な相互作用は、科学研究に燃料を加えるようなものであり、さまざまな分野で統合されたソリューションを絶えず生み出しています。
知識の階層的組織化:さまざまな分野の分類と同様に、AI4Science は、専門分野を包含し超越する高次の分野を表します。 AI4Science は、特定の科学分野における AI のより集中的なアプリケーションを結び付け、より広いコンテキストと意味を与えるマクロな視点を提供します。
コミュニティの大きな課題の解決: AI4Science は、単一の分野を超えた広範かつ大規模なコミュニティの課題を解決する独自の立場にあります。多様な視点と専門知識を結集することで、私たちのコミュニティは科学的な課題だけでなく、多様性、リソース、倫理、教育などの体系的な課題にも取り組むことができます。
ユニークなコラボレーションの機会: AI4Science は、共通の課題と方法論に直面しているさまざまな分野の専門家を集め、若い世代の間で知識を共有して複雑な問題をより効果的に解決する習慣を育みます。

写真

AI4Scienceは2023年にどのような進歩を遂げるでしょうか?

ここまで述べてきましたが、AI4Science は 2023 年にどのような進歩を遂げるのでしょうか?主催者はまず、いくつかの一般的な結論を述べました。

大規模言語モデル (LLM) はあらゆる分野に影響を及ぼしています。 AI は人間と機械の関わり方を変えており、化学や生物学の実験計画からコンピューターサイエンスにおけるより優れたアルゴリズムの発見、医療における汎用 AI エージェントとしての役割まで、さまざまな分野でその影響を発揮しています。率直に言えば、LLM は万能の万能薬のようなものです。会話アシスタントだけでなく、実験を行うのにも役立ちます。
データ生成と実験には自動化された実験室が使用されました。過去 1 年間で、AI を実験計画に統合し、ロボットを使用してその実行を自動化する上で大きな進歩が遂げられ、実験の統合と検証の間に橋が架けられました。これらの取り組みはまだ開発の初期段階ですが、AI 計画アルゴリズムのテストだけでなく、生成されるデータの質と量を大幅に向上させる可能性も有望視されています。これにより、実験検証が加速され、AI 発見のループが閉じられます。
設計には生成モデルが使用されます。 LLM だけでなく、拡散モデルも生成に役立ちます。拡散モデルは、新しい機能性タンパク質の設計、化学反応における遷移構造の捕捉、脳活動からの画像の再構築、量子色力学における場の構成のサンプリングなど、多くの分野で成功を収めています。
原子の大型モデルの開発。一般的な事前トレーニングにより大規模なモデルが生成され、その後下流のタスクで微調整されます。この慣行は科学界でますます人気が高まっています。過去 1 年間、この分野での取り組みは、特に原子力場と生物システムの「基本的な大規模モデル」に関して徐々に増加しました。
大手テクノロジー企業は AI4Science の限界を押し広げています。 Microsoft、Google DeepMind、Meta、Nvidia などの大手テクノロジー企業は、AI4Science への投資を大幅に増やしています。彼らの優れた計算能力と AI 科学者のパイプラインは、AI を活用するさまざまな科学分野の進歩を推進する上でますます影響力を増しています。
オープンソースとクローズドソース間の議論。残念なことに、過去 1 年間で AI4Science の作業の多くがオープンソースではないことを選択しており、学術コミュニティも例外ではありません。このため、再現性を重視した出版基準の見直しが必要になります。この議論は、科学コミュニティを責任ある効果的な共有へと導くために重要です。結局のところ、AI関連の分野はオープンソースのおかげで急速に発展してきました。

2023年のAI4Scienceを振り返って、主催者は7つの主要分野を分類しました。その中で、物理学、化学材料、生物学、医学はますます成熟し、ゆっくりと実験と融合し、徐々に商業化に向かっています。

物理

ブラックホールの最初の写真を処理した後、AI は人々が高エネルギーニュートリノ信号を識別するのを支援しました。

IceCubeチームは機械学習モデルを使用してIceCubeニュートリノ観測所のデータを分析し、信号データと背景データを区別することで、銀河面からの高エネルギーニュートリノの放出をこれまでにない精度で検出することができました。この研究では、イベントの選択に畳み込みニューラルネットワークを使用し、その高速推論 (数ミリ秒) 機能により、研究者はより複雑なイベントスクリーニング戦略を採用できるようになりました。

10 年間の観測データを通じて、機械学習モデルは継続的に改善され、宇宙のノイズを背景にニュートリノの特性を正確に特定できるようになりました。調査結果により、4.5シグマの有意性を持つニュートリノ放出が明らかになり、天の川銀河内に潜在的な発生源があることが示唆された。

この文脈において、機械学習の革新的な使用は、観測所の検出能力を高めるだけでなく、将来の天体物理学的探査のためのモデルも提供します。

化学と材料

化学材料のさまざまな分野でAIが活躍します。自動化学および材料合成の分野では、Koscher らの研究や Szymanski らによる A-Lab プロジェクトなどの研究により、人工知能と物理世界との架け橋が実証されています。これらのプロジェクトでは、自動化された実験室とクラウドベースのアプローチを通じて、新しい染料分子と無機材料を発見しました。

大規模言語モデルの応用では、Coscientist や ChemCrow などのプロジェクトが LLM を使用して実験を計画し、インターネット、モデル、実験装置との対話を可能にして、自動化されたタスクや複雑な実験室操作における LLM の大きな可能性を実証しています。

さらに、DeepMind の GNoME チームは、機械学習の手法を通じて多数の材料候補を予測し、材料科学におけるディープラーニングの応用を実証しました。

最後に、 MIT とコーネル大学の研究チームによって開発された OA-ReactDiff などの拡散モデルは、化学反応における遷移状態の探索において重要な進歩を遂げ、従来の方法よりも高速で効率的な代替手段と、予期しない反応経路を探索する能力を提供し、新しい触媒の発見と複雑な反応の研究を支援しています。

生物学

この分野は、タンパク質と他の生物学的小分子および大分子との相互作用を理解することに重点を置いています。

その中でも、RosettaFold-AA と AlphaFold-latest は、優れた代表例であり、タンパク質構造予測に限定されるだけでなく、タンパク質と小分子、タンパク質、核酸、その他の生物学的分子との相互作用の予測にも拡張されています。

静的なタンパク質構造の研究に加えて、タンパク質の立体配座空間の研究にも焦点が当てられています。たとえば、AF-Cluster は、複数の配列アラインメントを変更することで、AlphaFold を制御して異なる立体配座を出力します。

タンパク質の構造と機能の理解とは対照的に、タンパク質設計は、特定の構造と機能を実現するために新しいタンパク質を設計したり、既存のタンパク質を変更したりすることに重点を置いています。

幾何学的ディープラーニングと生成 AI (特に拡散モデル) の分野における進歩を基に、RFDiffusion と Chroma は、新しいタンパク質を生成するために空間対称性 (回転、平行移動、反射) を組み込んだ拡散モデルを提案しました。

彼らは、de novo設計に加えて、結合ターゲット、機能、構造に基づく条件や、モデルによって導かれる構造または機能の最適化など、柔軟なタンパク質設計と最適化の方法も提案しました。

薬

医療における AI の応用は、実際の応用シナリオと完全に統合されており、エンジニアリング指向になる傾向があります。

Moor らは、画像、電子健康記録、検査結果、ゲノミクス、グラフィックス、医療テキストなどのマルチモーダルデータを解釈できる汎用医療人工知能 (GMAI) システムを提案しました。 GMAI は、大規模で多様なマルチモーダルデータに基づいて自己教師あり方式で事前トレーニングされており、さまざまな医療アプリケーションを実行できます。

Singhalらは、医療分野における大規模な質問応答データセットをキュレーションし、AIモデルとして初めて米国医師免許試験に合格したPaLM（Googleの大規模言語モデル）、別名Med-PaLMをベースにした医療分野の大規模言語モデルを提案しました。

数か月後、同じ著者グループが Med-PaLM の第 2 バージョン (Med-PaLM 2) を提案しました。図に示すように、Med-PaLM 2 は重要なマイルストーン (86.5% (Med-PaLM2)、67.2% (Med-PaLM)) を達成し、人間の専門家に匹敵するレベルに到達し、USMLE スタイルの質問に答えることができるようになった最初のマシンとなりました。医師たちは、消費者の医療に関する質問に対して長文の回答を提供するモデルの能力が大幅に向上したことを指摘しました。

同時に、AI4Science も新たな道を切り開き、数学理論、地球科学、神経科学などの分野で急速に発展しています。

数学理論

今年、LLMは新しい理論とアルゴリズムの発見を始めました。 DeepMind (FunSearch) の最近の研究では、複雑な組み合わせ問題を解決する新しいプログラムを発見するための LLM の可能性が実証されています。 FunSearch の主な目的は、困難な問題を解決するためのより優れたプログラムを見つけることです。

具体的には、事前トレーニング済みの LLM と推定器の間で反復的かつ進化的なプロセスを採用します。このプロセスでは、進化アルゴリズムがプログラムプールから最適なプログラム候補を選択し、改善のために LLM に入力します。修正されたプログラムは評価され、採点され、プールに戻されました。この進化のプロセスでは、より優れた新しい手順が提案されます。彼らは、キャップセットとオンラインビンパッキングという 2 つの組み合わせ最適化問題で FunSearch の有効性を検証し、FunSearch は既知の最良のソリューションよりも優れたソリューションを見つけました。

地球科学

AI テクノロジーは、従来困難であった天気予報という課題において画期的な進歩を遂げました。

ClimaX、GraphCast、Pangu-Weather、MetNet-3、PreDiff などのプロジェクトは、数十年にわたる過去の気象データと数値物理シミュレーションの結果を活用して、短期および中期の気象予報のための高解像度の時空間予測技術を進歩させます。これらの成果は、高性能コンピューティングリソースと大量のデータの高度な処理に大きく依存しています。

GraphCast が、独自の「エンコーダー、プロセッサ、デコーダー」構造化グラフニューラルネットワークを通じて、空間的に構造化された気象データの処理に特化していることは、特に注目に値します。 ClimaX は、入力変数の任意の組み合わせに基づいて任意の時点での気象状況を予測できる、世界規模および地域規模のモデルと共通ベースモデルで知られています。

AIは天気予報だけでなく、地下構造、生物学、火山学など、データが限られている地球科学の分野でも進歩を遂げています。これらの分野では、軽量の AI エージェントモデルが、従来の計算集約型の数値物理シミュレーションに取って代わりつつあります。これらのモデルは予測を高速化するだけでなく、意思決定プロセスをより効率的にします。

神経科学

AI は脳波から画像を再構築し、人間に脳内の世界モデルに対するより深い洞察を得る機会を提供します。このタスクは常に困難でしたが、生成モデル（特に潜在空間拡散モデル）の革新により、このタスクが可能になりました。

脳活動データを「テキスト」として解釈すれば、脳活動データに基づいた画像を生成することができます。驚くべきことに、このタスクでは複雑なニューラルネットワークをトレーニングする必要はなく、脳データから潜在ベクトルとコンテキストベクトルへの線形マッピングのみをトレーニングする、事前トレーニング済みの安定拡散モデルを使用するだけで済みます。

さらに、AIは神経活動と行動の対応関係を理解するためにも使用されています。 CEBRA と呼ばれる方法は、仮説に基づく探索的分析に適用でき、複数の実験、動物、モダリティにわたる神経活動の一貫した解釈を表すことが示されています。この方法は、神経コーディングにおける時間構造の使用を最小限に抑え、結果の堅牢性を大幅に向上させ、神経科学研究における強力なツールとなる可能性があります。

今後の展望と課題

最後に、2023 年の狂乱を経て、主催者は 2024 年の AI4Science の発展に対する期待を表明しました。

オープンソースは科学的発見を加速させる鍵です。オープンソースは再現性を重視し、さまざまな分野間のコミュニケーション障壁を下げます。これは、AI4Science などの大規模統合の方向性においてさらに重要になります。 2023 年には、コミュニティがより閉鎖的になる傾向にあることに気づきました。したがって、私たちは未来に向かって進むにつれて、AI4Science コミュニティがオープンソースサイエンスの概念を受け入れることを奨励します。
AI4Science の特定の領域は概念実証段階から現実世界のアプリケーションへと移行しており、理論的知識が科学的発見のための信頼できるツールへと変化しています。これは概念的な面だけでなく、エンジニアリングや教育の取り組み、そしてリソースのサポートも必要とする大きな課題です。一般の人々が毎日目にする LLM の進歩と比較すると、AI4Science の商業化プロセスは、科学の「toB」の性質上、はるかに遅くなります。しかし、それは科学的発見を深め、広げるために必要なステップです。人類の科学の探究と変革は、それ自体が終わりのない長距離レースであり、忍耐と粘り強さを必要とします。
科学における大きな課題を解決するには、複数の分野にわたる知識が必要であり、人工知能と科学研究を前進させるには協力的な環境を構築することが不可欠です。これは、AI4Science の主催者である私たちが、すべての人のために作り出したいと願っている環境でもあります。
コミュニティが拡大し続けるにつれて、AI4Science ツールが悪用されるリスクも高まります。新しいアルゴリズムの進歩を開発する際には、倫理と安全性の問題を念頭に置く必要があります。

この記事は、AI4Science ワークショップの主催者の一部である Cheng Lixue、Du Yuanqi、Duan Chenru、Ada Fang、Fu Tianfan、Gao Wenhao、Huang Kexin、Liu Ziming、Luo Di、Wang Lijing (アルファベット順) が共同執筆しました。

<<: MIT の新しい研究: 労働者は AI によって排除されることを心配する必要はありません。コストは非常に高く、視覚的な作業の23％しか置き換えられない

>>: 世界中のロボットが1つの脳を共有する、Google DeepMindが第一歩を踏み出した