2021年、情熱的な若者のグループが、AI4Science(AI for Science)を機械学習のトップカンファレンスであるNeurIPSに導入することを提案しました。 何? AI4Science は学問分野ですか?世間の注目を集めるためにAIに頼っているのでしょうか?さまざまな疑問が次々と湧いてきました。 こうした疑問や混乱は、第 1 回 AI4Science ワークショップへの一般の参加が比較的低調であったことにも反映されていました。 時代は変わりました。過去2年間で、DeepMindがAlphaFoldをベースとしたIsomorphic Labを設立し、MicrosoftがAI4Science Initiativeを設立し、DeepMindやAISIなどの国内企業や学術機関がAI4Scienceの構築を積極的に推進し、成長と発展を続けています。 2023年8月には、Al4Scienceワークショップの主催者がNature誌にレビュー記事を発表し、過去数年間の科学的発見プロセスにおけるAl4Scienceの進歩をまとめ、将来への道を示しました。 昨年 12 月、NeurIPS、AI4Science ワークショップには 200 件を超える応募と数千人の参加者が集まり、NeurIPS で最大規模のワークショップの 1 つとなりました。これらの数字を見ると、AI4Science が誤った命題だと言う人はもういないようです。 最近、Al4Science ワークショップの主催者がブログを公開しました。 AI4Science を重視すべき理由についてお話しいただきましたか?化学、生物学、コンピューターサイエンス/数学科学、物理学、地球科学、神経科学から医学に至るまでの分野を網羅し、2023年にAI4Scienceが達成した進歩をまとめています。最後に、主催者は2024年のAI4Scienceの発展への期待を表明しました。 ブログアドレス: https://medium.com/@AI_for_Science/ai-for-science-in-2023-a-community-primer-d2c2db37e9a7 AI4Science を重視する理由は何ですか?AI が複数の分野で活躍するにつれて、別の疑問が生じます。なぜ AI4Science を重視するのでしょうか? AI4Drugs や AI4Materials などのサブ分野で誰もが AI を適用できればもっと良いのではないでしょうか?主催者はいくつかの理由を指摘している。
写真 AI4Scienceは2023年にどのような進歩を遂げるでしょうか?ここまで述べてきましたが、AI4Science は 2023 年にどのような進歩を遂げるのでしょうか?主催者はまず、いくつかの一般的な結論を述べました。
2023年のAI4Scienceを振り返って、主催者は7つの主要分野を分類しました。その中で、物理学、化学材料、生物学、医学はますます成熟し、ゆっくりと実験と融合し、徐々に商業化に向かっています。 物理 ブラックホールの最初の写真を処理した後、AI は人々が高エネルギーニュートリノ信号を識別するのを支援しました。 IceCubeチームは機械学習モデルを使用してIceCubeニュートリノ観測所のデータを分析し、信号データと背景データを区別することで、銀河面からの高エネルギーニュートリノの放出をこれまでにない精度で検出することができました。この研究では、イベントの選択に畳み込みニューラル ネットワークを使用し、その高速推論 (数ミリ秒) 機能により、研究者はより複雑なイベント スクリーニング戦略を採用できるようになりました。 10 年間の観測データを通じて、機械学習モデルは継続的に改善され、宇宙のノイズを背景にニュートリノの特性を正確に特定できるようになりました。調査結果により、4.5シグマの有意性を持つニュートリノ放出が明らかになり、天の川銀河内に潜在的な発生源があることが示唆された。 この文脈において、機械学習の革新的な使用は、観測所の検出能力を高めるだけでなく、将来の天体物理学的探査のためのモデルも提供します。 化学と材料 化学材料のさまざまな分野でAIが活躍します。自動化学および材料合成の分野では、Koscher らの研究や Szymanski らによる A-Lab プロジェクトなどの研究により、人工知能と物理世界との架け橋が実証されています。これらのプロジェクトでは、自動化された実験室とクラウドベースのアプローチを通じて、新しい染料分子と無機材料を発見しました。 大規模言語モデルの応用では、Coscientist や ChemCrow などのプロジェクトが LLM を使用して実験を計画し、インターネット、モデル、実験装置との対話を可能にして、自動化されたタスクや複雑な実験室操作における LLM の大きな可能性を実証しています。 さらに、DeepMind の GNoME チームは、機械学習の手法を通じて多数の材料候補を予測し、材料科学におけるディープラーニングの応用を実証しました。 最後に、 MIT とコーネル大学の研究チームによって開発された OA-ReactDiff などの拡散モデルは、化学反応における遷移状態の探索において重要な進歩を遂げ、従来の方法よりも高速で効率的な代替手段と、予期しない反応経路を探索する能力を提供し、新しい触媒の発見と複雑な反応の研究を支援しています。 生物学 この分野は、タンパク質と他の生物学的小分子および大分子との相互作用を理解することに重点を置いています。 その中でも、RosettaFold-AA と AlphaFold-latest は、優れた代表例であり、タンパク質構造予測に限定されるだけでなく、タンパク質と小分子、タンパク質、核酸、その他の生物学的分子との相互作用の予測にも拡張されています。 静的なタンパク質構造の研究に加えて、タンパク質の立体配座空間の研究にも焦点が当てられています。たとえば、AF-Cluster は、複数の配列アラインメントを変更することで、AlphaFold を制御して異なる立体配座を出力します。 タンパク質の構造と機能の理解とは対照的に、タンパク質設計は、特定の構造と機能を実現するために新しいタンパク質を設計したり、既存のタンパク質を変更したりすることに重点を置いています。 幾何学的ディープラーニングと生成 AI (特に拡散モデル) の分野における進歩を基に、RFDiffusion と Chroma は、新しいタンパク質を生成するために空間対称性 (回転、平行移動、反射) を組み込んだ拡散モデルを提案しました。 彼らは、de novo設計に加えて、結合ターゲット、機能、構造に基づく条件や、モデルによって導かれる構造または機能の最適化など、柔軟なタンパク質設計と最適化の方法も提案しました。 薬 医療における AI の応用は、実際の応用シナリオと完全に統合されており、エンジニアリング指向になる傾向があります。 Moor らは、画像、電子健康記録、検査結果、ゲノミクス、グラフィックス、医療テキストなどのマルチモーダル データを解釈できる汎用医療人工知能 (GMAI) システムを提案しました。 GMAI は、大規模で多様なマルチモーダル データに基づいて自己教師あり方式で事前トレーニングされており、さまざまな医療アプリケーションを実行できます。 Singhalらは、医療分野における大規模な質問応答データセットをキュレーションし、AIモデルとして初めて米国医師免許試験に合格したPaLM(Googleの大規模言語モデル)、別名Med-PaLMをベースにした医療分野の大規模言語モデルを提案しました。 数か月後、同じ著者グループが Med-PaLM の第 2 バージョン (Med-PaLM 2) を提案しました。図に示すように、Med-PaLM 2 は重要なマイルストーン (86.5% (Med-PaLM2)、67.2% (Med-PaLM)) を達成し、人間の専門家に匹敵するレベルに到達し、USMLE スタイルの質問に答えることができるようになった最初のマシンとなりました。医師たちは、消費者の医療に関する質問に対して長文の回答を提供するモデルの能力が大幅に向上したことを指摘しました。 同時に、AI4Science も新たな道を切り開き、数学理論、地球科学、神経科学などの分野で急速に発展しています。 数学理論 今年、LLMは新しい理論とアルゴリズムの発見を始めました。 DeepMind (FunSearch) の最近の研究では、複雑な組み合わせ問題を解決する新しいプログラムを発見するための LLM の可能性が実証されています。 FunSearch の主な目的は、困難な問題を解決するためのより優れたプログラムを見つけることです。 具体的には、事前トレーニング済みの LLM と推定器の間で反復的かつ進化的なプロセスを採用します。このプロセスでは、進化アルゴリズムがプログラム プールから最適なプログラム候補を選択し、改善のために LLM に入力します。修正されたプログラムは評価され、採点され、プールに戻されました。この進化のプロセスでは、より優れた新しい手順が提案されます。彼らは、キャップ セットとオンライン ビン パッキングという 2 つの組み合わせ最適化問題で FunSearch の有効性を検証し、FunSearch は既知の最良のソリューションよりも優れたソリューションを見つけました。 地球科学 AI テクノロジーは、従来困難であった天気予報という課題において画期的な進歩を遂げました。 ClimaX、GraphCast、Pangu-Weather、MetNet-3、PreDiff などのプロジェクトは、数十年にわたる過去の気象データと数値物理シミュレーションの結果を活用して、短期および中期の気象予報のための高解像度の時空間予測技術を進歩させます。これらの成果は、高性能コンピューティング リソースと大量のデータの高度な処理に大きく依存しています。 GraphCast が、独自の「エンコーダー、プロセッサ、デコーダー」構造化グラフ ニューラル ネットワークを通じて、空間的に構造化された気象データの処理に特化していることは、特に注目に値します。 ClimaX は、入力変数の任意の組み合わせに基づいて任意の時点での気象状況を予測できる、世界規模および地域規模のモデルと共通ベース モデルで知られています。 AIは天気予報だけでなく、地下構造、生物学、火山学など、データが限られている地球科学の分野でも進歩を遂げています。これらの分野では、軽量の AI エージェント モデルが、従来の計算集約型の数値物理シミュレーションに取って代わりつつあります。これらのモデルは予測を高速化するだけでなく、意思決定プロセスをより効率的にします。 神経科学 AI は脳波から画像を再構築し、人間に脳内の世界モデルに対するより深い洞察を得る機会を提供します。このタスクは常に困難でしたが、生成モデル(特に潜在空間拡散モデル)の革新により、このタスクが可能になりました。 脳活動データを「テキスト」として解釈すれば、脳活動データに基づいた画像を生成することができます。驚くべきことに、このタスクでは複雑なニューラル ネットワークをトレーニングする必要はなく、脳データから潜在ベクトルとコンテキスト ベクトルへの線形マッピングのみをトレーニングする、事前トレーニング済みの安定拡散モデルを使用するだけで済みます。 さらに、AIは神経活動と行動の対応関係を理解するためにも使用されています。 CEBRA と呼ばれる方法は、仮説に基づく探索的分析に適用でき、複数の実験、動物、モダリティにわたる神経活動の一貫した解釈を表すことが示されています。この方法は、神経コーディングにおける時間構造の使用を最小限に抑え、結果の堅牢性を大幅に向上させ、神経科学研究における強力なツールとなる可能性があります。 今後の展望と課題 最後に、2023 年の狂乱を経て、主催者は 2024 年の AI4Science の発展に対する期待を表明しました。
この記事は、AI4Science ワークショップの主催者の一部である Cheng Lixue、Du Yuanqi、Duan Chenru、Ada Fang、Fu Tianfan、Gao Wenhao、Huang Kexin、Liu Ziming、Luo Di、Wang Lijing (アルファベット順) が共同執筆しました。 |
<<: MIT の新しい研究: 労働者は AI によって排除されることを心配する必要はありません。コストは非常に高く、視覚的な作業の23%しか置き換えられない
>>: 世界中のロボットが1つの脳を共有する、Google DeepMindが第一歩を踏み出した
2020年は忘れられない年です。今年に入って、新型コロナウイルスの感染拡大に伴い、人工知能(AI)が...
最近、ChatGPT を使用しているときに小さな問題に遭遇しました。特殊な状況のため、syslog ...
強化学習 (RL) アルゴリズムのトレーニング プロセスでは、サポートとして環境との相互作用のサンプ...
この記事では、TensorFlow 2.0 の 10 の機能について説明します。 [[326673]...
「自動化」の本質的な意味は変わりませんが、その用語の使用法は時間の経過とともに確実に変化してきました...
従来の産業および製造現場では、作業者の安全の監視、オペレーターの効率性の向上、品質検査の改善はすべて...
この記事では、人間が持っているが機械がまだ獲得していないいくつかの必要な能力を列挙し、現在の開発動向...
[[392106]] AI は広く普及しているにもかかわらず、知識と認識のギャップにより、商業的な導...
9月27日、ネイチャー誌は45の機関からなる国際科学研究チームの最新の研究成果を発表した。 200...
[[220444]]この記事では、TensorFlowの例をいくつか見て、テンソルテンソルまた、テン...
翻訳者 | 朱 仙中校正 | 梁哲、孫淑娟K 近傍法 (KNN) は、機械学習アルゴリズムにおける回...