AlphaFold2 の原理: 注意メカニズムが畳み込みネットワークに取って代わり、予測精度が 30% 以上向上

[[412540]]

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

最近、DeepMind が AlphaFold2 をオープンソース化し、再び学界に波紋を巻き起こしました。

つまり、かつては一般の研究者が解明するのに数年かかっていたタンパク質構造が、AlphaFold2 を使用すればわずか数時間で計算できるようになったのです。

では、AlphaFold2 はどのようにしてこのような強力な機能を実現しているのでしょうか?

DeepMindチームは詳細な情報をNature誌に公開した。

それでは、AlphaFold2 の魔法がどのように実現されるかを見てみましょう。

畳み込みはなくなり、注目が集まる

論文の中で研究者らは、AlphaFold2はAlphaFoldとは全く異なる新しいモデルであると強調した。

実際、それらは異なるモデルフレームワークを使用しており、これが AlphaFold2 の精度が飛躍的に向上できる主な理由です。

AlphaFold のこれまでの畳み込みニューラルネットワークはすべてAttentionに置き換えられました。

なぜこれをするのですか?

まず、AlphaFold がどのように動作するかを理解する必要があります。

これは主に、タンパク質内の各アミノ酸ペア間の距離分布と、それらを結ぶ化学結合間の角度を予測し、すべてのアミノ酸ペアの測定値を 2D 距離ヒストグラムにまとめます。

次に、畳み込みニューラルネットワークを使用してこれらの画像を学習し、タンパク質の 3D 構造を構築します。

△AlphaFoldのメインアーキテクチャ

しかし、これは予測に対する局所的なアプローチであり、タンパク質構造情報の長期的な依存性を無視する可能性があります。

Attention の特性は、まさにこの欠点を補うことができます。これは、人間の注意を模倣し、複数の詳細に同時に焦点を合わせることができるネットワークアーキテクチャです。

これにより、フレームワークの予測結果がより包括的かつ正確になります。

CASP13では、AlphaFoldの予測精度は60ポイント未満でした。

しかし、CASP14では、AlphaFold2によって精度が直接92.4/100に向上しました。

グラフネットワーク + 注意

具体的には、AlphaFold2 は主に多重配列アライメント (MSA) を使用して、タンパク質構造と生物学的情報をディープラーニングアルゴリズムに統合します。

主にニューラルネットワークEvoFormerと構造モジュールの2 つの部分で構成されます。

EvoFormer では、構造予測は主にグラフネットワークと多重配列アライメント(MSA) を組み合わせることによって実現されます。

グラフネットワークは、物事の相関関係をうまく表現できます。ここでは、異なるアミノ酸間の距離を表すために、タンパク質関連情報のグラフを構築できます。

研究者らは、Attention メカニズムを使用して、アミノ酸間の関係グラフを処理するための特別な「三角形の自己注意メカニズム」を構築しました。

△三角形の自己注意

次に、このステップからの情報を多重配列アライメントと組み合わせました。

多重配列アライメントの主な目的は、同じ残基の部位を同じ列に配置し、異なる配列間の類似性を明らかにし、それによって異なるタンパク質間の構造と機能の類似性を推測することです。

計算されたアミノ酸関係は MSA と情報を交換し、空間的および進化的関係のペア表現を直接推測できます。

すべての原子の3D構造を予測する

アーキテクチャの 2 番目の部分は構造モジュールであり、その主な役割は、EvoFormer によって取得された情報をタンパク質の 3D 構造に変換することです。

△構造モジュール

ここで研究者らは、タンパク質の各部分を個別に計算できる「不変点注意」メカニズムと呼ばれる注意メカニズムも使用しました。

ある原子を原点として3D参照フィールドを構築し、予測情報に従って回転・平行移動し、構造フレームワークを取得します。

△不変点の注目

次に、Attention メカニズムがすべての原子を予測し、最終的に非常に正確なタンパク質構造を要約します。

さらに研究者らは、AlphaFold2 が「エンドツーエンド」のニューラルネットワークであることも強調しました。

最終的な損失を出力結果に繰り返し適用し、出力結果を再帰的に適用して、正しい結果に継続的に近づきます。

そうすることで、追加のトレーニングを削減できるだけでなく、予測される構造の精度も大幅に向上します。

タンパク質の折り畳みの謎を解く希望をもたらす

Alphafold2 の出現により、タンパク質と分子の結合確率をより正確に予測できるようになり、新薬の研究開発の効率が大幅に向上します。

Alphafold2 のオープンソースは科学コミュニティをさらに発展させるでしょう。

DeepMindは現在、スイスのいくつかの研究チームと協力して、タンパク質構造を予測することで医薬品の研究を行っているとみられる。

実際、Alphafold2 予測プログラム自体を研究することで、タンパク質構造の折り畳みの原理を探求する希望も生まれます。

シカゴ大学の計算生物学者ジンボ・シュー氏はこう語った。

これらのツールはオープンソースであるため、科学コミュニティはそれらに基づいてさらに強力なソフトウェアを開発できます。

論文の宛先:
https://www.nature.com/articles/s41586-021-03819-2_reference.pdf

補足資料:
https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-021-03819-2/MediaObjects/41586_2021_3819_MOESM1_ESM.pdf*

<<: ICML賞を受賞したばかりの機械学習の専門家マックス・ウェリング氏がマイクロソフトに入社し、分子シミュレーションに注力

>>: 人工知能による画像認識では、データのラベル付けはどのように機能するのでしょうか?

ルカンはソラを世界モデルとして非難し、自己回帰LLMは単純すぎると述べた。

ブログ

AIがCIOの役割をどう変えるのか

ブログ

投資管理と AI: 顧客関係と投資収益の向上

ブログ

人工知能は仕事をなくしてしまうのでしょうか？マスク氏の提案を聞いてみましょう。

ブログ

5G車道協調自動運転技術の応用について解説した記事

ブログ

人工知能の新たなブレークスルー：ニューラルネットワークが画像内の物体を自律的に識別できる

ブログ

新しい特許は、Appleのリサイクルロボットが爆発するバッテリーから身を守ることができることを示している

ブログ

上海交通大学が「人間行動理解エンジン」を発表：AIが超大作映画のあらゆる行動をフレームごとに理解

ブログ

天地万能？疫病の流行に直面して、これらの AI は静かにあなたを守っています...

ブログ

AlphaFold2 の原理: 注意メカニズムが畳み込みネットワークに取って代わり、予測精度が 30% 以上向上

畳み込みはなくなり、注目が集まる

グラフネットワーク + 注意

すべての原子の3D構造を予測する

タンパク質の折り畳みの謎を解く希望をもたらす

ルカンはソラを世界モデルとして非難し、自己回帰LLMは単純すぎると述べた。

AIがCIOの役割をどう変えるのか

投資管理と AI: 顧客関係と投資収益の向上

人工知能は仕事をなくしてしまうのでしょうか？マスク氏の提案を聞いてみましょう。

5G車道協調自動運転技術の応用について解説した記事

人工知能の新たなブレークスルー：ニューラルネットワークが画像内の物体を自律的に識別できる

新しい特許は、Appleのリサイクルロボットが爆発するバッテリーから身を守ることができることを示している

上海交通大学が「人間行動理解エンジン」を発表：AIが超大作映画のあらゆる行動をフレームごとに理解

天地万能？疫病の流行に直面して、これらの AI は静かにあなたを守っています...

推薦する

カスタムデータセットにOpenAI CLIPを実装する

AIがエンタープライズデータカタログを救う方法

世界を変えた10人のアルゴリズムマスター

マスク氏はAIが人間を超えると述べ、それを信じない人は単に賢いだけだと語る

騒動を巻き起こしたディープマインドの論文は万能ではない

IoT生体認証は職場でより大きな役割を果たす

エージェントは人間のように協力し、「グループチャット」を通じて情報を交換することができます。

ディープラーニングを使用して、あなたのようにチャットできるロボットをトレーニングするにはどうすればよいでしょうか?

AIモデルをGTAの5つ星プレイヤーにしよう、視覚ベースのプログラム可能なエージェントOctopusが登場