生物学における最大の謎の一つであるタンパク質折り畳み問題が AI によって解決されました。 CASP14の主催者であり、カリフォルニア大学デービス校の科学者で70歳近いアンドリー・クリシュタフォヴィチ氏は、会議で「これを見ることができるほど長く生きられるかどうか自信がなかった」と嘆いた[1]。 11月30日、テクノロジー界の注目を集めた大ニュースがあった。Google傘下の人工知能技術企業DeepMindが提案したディープラーニングアルゴリズム「Alphafold」が、50年来の課題であったタンパク質分子の折り畳み問題を解決したのだ。 最新世代のアルゴリズムである Alphafold 2 は、タンパク質の 3D 折り畳み形状を予測できるようになりました。この複雑なプロセスは、生命形成のメカニズムを理解する上で非常に重要です。 DeepMindの重大な科学的進歩のニュースが発表されるとすぐに、「Nature」や「Science」などの科学雑誌で報道され、サンダー・ピチャイ、イーロン・マスクらが直ちに新たな成果を祝福した。 科学者らは、アルファフォールドの画期的な研究成果は、研究者らが特定の病気を引き起こすメカニズムを理解するのに役立ち、薬剤の設計、農作物の収穫量の増加、プラスチックを分解できる「スーパー酵素」の開発への道を開くだろうと述べている。 「研究分野にとって、今は刺激的な時期だ」とディープマインドの創設者兼CEOであるデミス・ハサビス氏は語った。 「これらのアルゴリズムは、現在では、非常に難しい科学的問題に適用できるほど成熟し、強力になっています。」 タンパク質は生命に不可欠なものであり、アミノ酸の鎖で構成された大きく複雑な分子であり、その機能は独自の 3D 構造によって決まります。タンパク質がどのような形に折り畳まれるかを解明することを「タンパク質折り畳み問題」と呼びます。タンパク質の折り畳みは、過去 50 年間、生物学における大きな課題でした。 DeepMind の AlphaFold は、この点で重要な進歩を遂げました。今年の国際タンパク質構造予測コンテストCASPでは、DeepMindが開発した最新バージョンのAlphaFoldが他の出場者を打ち負かし、精度の面では人間の実験結果に匹敵する結果となり、タンパク質の折り畳み問題の解決策となるとみられている。この画期的な進歩は、AI が科学的発見、特に基礎科学研究に与える影響を実証しています。 2年に一度開催される CASP コンテストでは、グループが最初にタンパク質の 3D 構造を予測することを競います。今年、AlphaFold は他のすべてのグループに勝ち、精度の点で実験結果と一致しました。 生物学分野に詳しくない人にとって、CASP という名前は馴染みがないかもしれません。CASP は「The Critical Assessment of protein Structure Prediction」の略で、タンパク質構造予測を評価することを目的としており、タンパク質構造予測のオリンピック競技として知られています。 CASPは1994年以来2年ごとに開催されており、現在は11月30日に始まったCASP14です。 DeepMind によるこの画期的な進歩はどのような影響を与えるのでしょうか? コロンビア大学の計算生物学者、モハメッド・アルクライシ氏はネイチャー誌の記事で、「これはタンパク質構造予測の分野に多大な影響を与えると言えるでしょう。核心的な問題が解決されたので、この分野を去る人はあまりいないでしょう。これは第一級の科学的進歩であり、私の生涯で最も重要な科学的業績の1つです」と述べています。 タンパク質の折り畳み問題 タンパク質の形状はその機能と密接に関係しており、タンパク質の構造を予測することは、その機能と動作原理を理解する上で非常に重要です。産業廃棄物を分解する酵素の発見など、人類を悩ませている最大の問題の多くは、根本的にはタンパク質とその役割に関係しています。 タンパク質の構造は長年にわたり注目されている研究テーマです。研究者は、核磁気共鳴、X 線、クライオ電子顕微鏡などの一連の実験技術を使用して、タンパク質の構造を検出および決定します。しかし、これらの方法は多くの試行錯誤と高価な機器に依存することが多く、研究される構造ごとに何年もかかることがあります。 1972年、アメリカの科学者クリスチャン・アンフィンセンは、リボヌクレアーゼ、特にそのアミノ酸配列と生物学的に活性な構造との関係に関する研究によりノーベル化学賞を受賞しました。授賞式で彼は有名な仮説を提唱した。理論的には、タンパク質のアミノ酸配列によってその構造を完全に決定できるはずだ、というものである。この仮説は、1 次元のアミノ酸配列のみに基づいてタンパク質の 3 次元構造を計算するという 50 年にわたる探求のきっかけとなりました。 しかし、このアプローチの課題は、タンパク質が三次元構造を形成する前に、理論上は折り畳み可能な方法の数が天文学的な数になるということです。 1969 年、サイラス・レビンサルは、タンパク質の可能な立体配座を力ずくで列挙すると、宇宙の年齢よりも長い時間がかかるだろうと指摘しました。レビンサルは、タンパク質にはおよそ 10^300 通りの立体配座が存在すると推定しました。しかし、自然界では、タンパク質は自発的に、時にはわずか数ミリ秒で折り畳まれます。これは「レビンタールのパラドックス」として知られる現象です。 タンパク質の折り畳みに関するビデオについては、以下をクリックしてください。 https://v.qq.com/x/page/q3208094b83.html CASP 14コンペティションの最新結果:AlphaFoldのGDTの中央値は92.4にまで上昇 CASP コンテストは、1994 年に John Moult 教授と Krzysztof Fidelis 教授によって設立され、タンパク質構造予測における新しい SOTA 研究を促進するために 2 年ごとにブラインド レビューが行われています。 CASP では従来、参加チームがタンパク質構造予測手法をテストするためのターゲットとして、最近になって実験的に決定されたばかりのタンパク質構造を選択してきました (評価時点でもまだ決定中の構造もあります)。これらのタンパク質構造は事前に公開されず、出場者はその構造についてブラインドテストを実施し、最終的に予測結果を実験データと比較する必要があります。この厳格な評価原則に基づいて、CASP は予測技術評価の「ゴールド スタンダード」と呼ばれています。 CASP が予測精度を測定するために使用する主な指標は GDT (Global Distance Test) です。これは 0 から 100 の範囲で、正しい位置のしきい値距離内にある予測されたアミノ酸残基の割合として理解できます。ジョン・モールト教授は、GDTスコアが約90であれば、人間を対象とした実験方法と同等とみなせると述べた。 先日発表された第 14 回 CASP 評価結果では、DeepMind の最新の AlphaFold システムがすべての予測ターゲットの中で平均 GDT 92.4 を達成しました。これは、平均誤差が約 1.6 オングストローム、つまり原子の幅 (0.1 ナノメートル) に相当することを意味します。最も難しいフリーモデリング カテゴリでも、AlphaFold は GDT の中央値 87.0 を達成しました。 BEST-OF-5 GDT で測定された、以前の CASP コンペティションのフリー モデリング カテゴリにおける平均予測精度の向上。 CASP コンペティションのフリー モデリング カテゴリにおける 2 つのターゲット タンパク質の例。 AlphaFold はタンパク質構造を高い精度で予測できます。 これらの刺激的な結果により、生物学者が計算による構造予測を科学研究の主要なツールとして使用する時代の幕開けとなりました。 DeepMind が提案した方法は、膜タンパク質などの特定の重要なタンパク質クラスに特に役立ちます。膜タンパク質は結晶化が難しく、実験的にその構造を決定することが困難です。
DeepMindがタンパク質の折り畳み問題を解決する方法 2018年、DeepMindチームはAlphaFoldの初期バージョンを使用してCASP13コンペティションに参加し、最高の精度を達成しました。その後、DeepMind は CASP13 メソッドと関連コードを Nature に公開しました。現在、DeepMind チームは新しいディープラーニング アーキテクチャを開発し、それを使用して CASP14 コンテストに参加し、前例のないレベルの精度を達成しました。これらの方法は、生物学、物理学、機械学習、そして過去半世紀にわたるタンパク質折り畳みの分野での多くの科学者の研究からインスピレーションを得ています。 タンパク質の折り畳みは、ノードが残基を表し、エッジが残基を密接に接続する「空間グラフ」として考えることができます。この空間マップは、タンパク質内の物理的相互作用とその進化の歴史を理解するために重要です。 CASP14 コンテストで使用された最新バージョンの AlphaFold では、 DeepMind チームが注目度ベースのニューラル ネットワーク システムを作成し、構築した暗黙のグラフに基づいて推論を実行しながらグラフ構造を理解するようにエンドツーエンドでトレーニングしました。この方法では、進化的に関連する配列、多重配列アライメント (MSA)、およびアミノ酸残基ペアの表現を使用してグラフを改良します。 このプロセスを繰り返すことで、システムはタンパク質の基礎となる物理的構造を強力に予測し、数日以内に非常に正確な構造を決定することができます。さらに、AlphaFold は内部の信頼性メトリックを使用して、予測された各タンパク質構造のどの部分の信頼性が高いかを判断します。 DeepMind チームは、タンパク質構造データベース (PDB) の公開データと、未知の構造のタンパク質配列を含む大規模なデータベース (合計約 170,000 個のタンパク質構造) に基づいてシステムをトレーニングしました。このシステムは、約 128 個の TPUv3 コア (100 ~ 200 個の GPU に相当) を使用して数週間実行されますが、これは今日の機械学習で使用されている大規模な最先端モデルと比較すると比較的小規模です。 さらに、DeepMind チームは、この新しい AlphaFold システムに関連する論文を適切な時期に査読付き学術誌に提出する準備ができていることを明らかにしました。 AlphaFold の主なニューラル ネットワーク モデル アーキテクチャの概要。このモデルは、進化的に関連するタンパク質配列とアミノ酸残基のペアに基づいて動作し、それらの表現間で情報を繰り返し転送してタンパク質構造を生成します。 現実世界への潜在的な影響 「AIのブレークスルーが、人々が基礎科学の問題をさらに理解するのに役立つようにしましょう。」4年間の研究開発を経て、AlphaFoldは現在、DeepMindが設立した当初のビジョンを徐々に実現し、医薬品の設計や環境の持続可能性などの分野に大きな影響を与えています。 マックス・プランク進化生物学研究所所長でCASP評価者のアンドレイ・ルパス教授は次のように語った。「AlphaFoldの精密なモデルにより、10年近く謎だったタンパク質構造を解明し、細胞膜を介したシグナルの伝達方法についての研究を再開することができる。」 DeepMindは、今後数年間でAlphaFoldの可能性をさらに理解するために他の研究者と協力する意向を表明した。 DeepMind は、査読済み論文の作成に加えて、可能な限りスケーラブルな方法でシステムをより広く利用できるようにする方法を模索しています。 同時に、DeepMind の研究者たちは、タンパク質構造の予測が特定の病気の理解にどのように役立つかについても研究しました。たとえば、機能不全のタンパク質を特定し、それらがどのように相互作用するかを推測することで、いくつかの病気のメカニズムを理解するのに役立ちます。この情報により、より正確な医薬品開発が可能になり、既存の実験的アプローチを補完し、より有望な治療法をより早く見つけることができるようになります。
同時に、タンパク質構造予測が将来のパンデミック対応に役立つという証拠も数多くあります。今年初め、DeepMindはAlphaFoldを使用して、ORF3aを含むいくつかの未知のコロナウイルスタンパク質構造を予測しました。 CASP14では、AlphaFoldは別のコロナウイルスタンパク質ORF8の構造を予測しました。現在、実験者らはORF3aとORF8の構造を確認している。課題と関連配列の不足にもかかわらず、AlphaFold は実験的に決定された構造と比較して、両方の予測で高い精度を達成しました。 AlphaFold は、既知の疾患に対する理解を加速させるだけでなく、現在モデルが存在しない何億ものタンパク質や、未知の生物の広大な領域を探索するなど、多くの刺激的な技術的可能性を秘めています。 DNA はタンパク質の構造を構成するアミノ酸の配列を指定するため、ゲノミクス革命により、自然界のタンパク質配列を大規模に読み取ることが可能になりました。Universal Protein Database (UniProt) には 1 億 8,000 万のタンパク質配列が登録されています。対照的に、配列から構造に至るまでに必要な実験作業を考慮すると、タンパク質データバンク (PDB) には約 170,000 個のタンパク質構造しかありません。未解明のタンパク質には、新しい未解明の機能があるかもしれません。望遠鏡が人類が未知の宇宙をより深く観察するのに役立つのと同じように、AlphaFold のような技術は未解明のタンパク質構造の発見に役立ちます。 新たな可能性を切り開く AlphaFold は DeepMind のこれまでの最も重要な進歩の 1 つですが、その後の科学的研究が進むにつれて、解決すべき問題がまだ多く残っています。 DeepMind によって予測された構造のすべてが完璧というわけではありません。複数のタンパク質がどのように複合体を形成するのか、DNA、RNA、または小分子とどのように相互作用するのか、すべてのアミノ酸側鎖の正確な位置をどのように決定するのかなど、まだ学ぶべきことはたくさんあります。さらに、他者と協力する過程で、新薬開発や環境管理など、さまざまな側面にこれらの科学的発見をどのように最適に適用するかを学ぶ必要もあります。 科学の分野で計算や機械学習の手法に取り組んでいる私たち全員にとって、AlphaFold のようなシステムは、基礎的な発見を支援する AI の驚くべき可能性を示しています。 50年前にアメリカの生化学者アンフィンセンが提唱した挑戦が当時の科学研究能力をはるかに超えていたように、この世界には未だに未知の部分が多く残っています。 DeepMind によるこの進歩は、AI が科学的知識の限界を広げる人類の最も有用なツールの 1 つになるという人々の信念を強めるものであり、私たちは今後数年間のさらなる偉大な発見をもたらすための努力にも期待しています。 AlphaFold の科学的ブレークスルーに関連するビデオについては、以下をクリックしてください。 https://v.qq.com/x/page/d3208wl42dz.html |
<<: AIが中国の山水画を生成!プリンストン大学の女子学生が卒業制作で描いた線と筆致は、人間の観察者の半数を騙した。
困難な一年であったにもかかわらず、世界中の多くの企業が、ビジネスを最大化するために人工知能(AI)を...
序文近年、ディープラーニングは音声、画像、自然言語処理などの分野で優れた成果を上げており、最も注目さ...
サービスロボットはニッチな領域を超えつつあるようだ。まず、2018年の世界ロボット産業の市場規模は2...
[51CTO.com クイック翻訳] 統計によると、回答者が現在選択している最も一般的に使用されてい...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
10年越しの自動車製造の夢は完全に打ち砕かれ、タイタン計画は終了!言い換えれば、過去10年間にApp...