DeepMind が新世代 AlphaFold を発表、予測精度が 10% 近く向上しました。 DNAとRNAのAlphaFoldの瞬間が到来

DeepMind が新世代 AlphaFold を発表、予測精度が 10% 近く向上しました。 DNAとRNAのAlphaFoldの瞬間が到来

ちょうど本日、DeepMind は AlphaFold の最新の進捗状況である「AlphaFold-latest」を発表しました。

DeepMind が発表した最新の技術レポートによると、新世代の AlphaFold は、タンパク質構造をより正確に処理および予測できるだけではありません。

、再生時間 01:32

また、核酸や任意の小分子リガンドなどの他の生物学的分子構造に同様の機能を拡張することもできます。

新しい AlphaFold はまだ完全には開発されていないものの、その性能は非常に優れているため、DeepMind はこれを事前に公開せずにはいられません。

レポートアドレス: https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/a-glimpse-of-the-next-generation-of-alphafold/alphafold_latest_oct2023.pdf

DeepMindは、新モデルの機能拡張と性能向上により、生物医学の進歩が加速し、疾患経路、ゲノミクス、バイオ再生可能材料、植物免疫、潜在的な治療標的、薬物設計メカニズムなど、さまざまな新たな可能性がもたらされると述べた。

AlphaFold は生物学の発展における新しい時代、「デジタル生物学」の時代を切り開きました。

次世代のAlphaFoldが先行公開

AlphaFold の新バージョンに実装された新機能を詳しく見てみましょう。

「AlphaFold-latest」はまだプレビュー段階であり、開発はまだ完了していませんが、タンパク質構造の予測を超えた幅広いタスクで驚くべきパフォーマンスを発揮しています。

「AlphaFold-latest」は、2022年末のAlphaFold 2.3バージョンをベースに構築されており、特に抗体構造と組み合わせたタンパク質構造の予測において優れたパフォーマンスを発揮します。

AlphaFold-latest は、リボソームなどの重要な細胞成分を構成するタンパク質-核酸複合体の構造を予測する上で、他のモデルよりも大幅に優れたパフォーマンスを発揮します。

また、RNA 構造の予測においても他のモデルよりも優れたパフォーマンスを発揮しますが、人間の専門家の予測パフォーマンスと比較すると、さらに改善する余地がまだあります。

複合医薬品開発の重要な部分であるリガンドについても、「AlphaFold-latest」は PoseBusters ベンチマークで AutoDock Vina などの従来のモデルよりも優れた性能を発揮します。

さらに、ベースラインでは「AlphaFold-latest」では取得できなかった実際のタンパク質構造情報を取得できたというテスト結果が得られました。

また、残基の修飾(タンパク質のグリコシル化など)を伴う多くの生物学的プロセスについては、「AlphaFold-latest」は、共有結合したリガンド、グリコシル化、修飾残基など、生物学的分子に現れるさまざまな特徴の構造を予測できます。

この一連の成果は、AlphaFold メソッドを使用することで、すべての重要な生体分子とその相互作用について原子レベルの正確な構造予測を行うことができることを示しています。

AlphaFold は「デジタル生物学」の先駆者

AlphaFold は 2020 年のリリース以来、人間がタンパク質とその相互作用を理解する方法に革命をもたらしました。

その後数年間、Google DeepMind と Isomorphic Labs は協力してより強力な AI モデルを開発し、予測の範囲をタンパク質からあらゆる生物学的分子にまで拡大してきました。

AlphaFold の新しいモデルは、バイオ医薬品の全体的な発展を加速することができます。

創薬の加速

タンパク質リガンド構造の正確な予測は、薬剤になる可能性のある新しい分子を科学者が特定して設計するのに役立つため、薬剤発見にとって貴重なツールとなります。

現在の業界標準では、リガンドとタンパク質間の相互作用を決定するために「ドッキング法」を使用しています。

これらの方法では、タンパク質の構造とリガンド結合の可能性のある場所を厳密に参照する必要があります。

「AlphaFold-latest」は、既存の最良のドッキング手法を上回り、タンパク質-リガンド構造予測の新たなベンチマークを確立しました。

タンパク質構造やリガンドポケットの位置を参照する必要がないため、これまで構造的に特徴付けられていない新しいタンパク質を予測できます。

また、すべての原子の位置の共同モデリングも可能になり、他の分子と相互作用する際のタンパク質や核酸の固有の柔軟性を完全に表現できるようになります。これはドッキング法では不可能なことです。

たとえば、最新のモデルによって予測された構造 (色で強調表示) が実験的に決定された構造 (灰色) と密接に一致する、最近発表された治療に関連する 3 つの事例を以下に示します。

  1. PORCN: 標的に結合する臨床段階の抗癌分子。
  2. KRAS: 重要な癌標的である共有結合リガンド(分子接着剤)との三元複合体。
  3. PI5P4Kγ: がんや免疫疾患を含む複数の疾患に影響を与える脂質キナーゼの選択的アロステリック阻害剤。

Isomorphic Labs は、次世代の AlphaFold モデルを治療薬の設計に適用し、病気の治療に重要な複数の種類の高分子構造を迅速かつ正確に特徴付けるのに役立っています。

生物学の新たな理解を探る

タンパク質やリガンド構造、および翻訳後修飾を含む核酸や構造のモデリングを解き放つことで、モデルは基礎生物学を調べるためのより高速で正確なツールを提供します。

DeepMind は CasLambda 構造の例を示しました。

これは、crRNA と DNA を組み合わせた構造であり、CRISPR ファミリーの一部です。

CasLambda は、一般に「遺伝子はさみ」として知られる CRISPR-Cas9 システムのゲノム編集機能を備えており、研究者はこれを使用して動物、植物、微生物の DNA を変更できます。

CasLambda のサイズが小さいほど、より効率的な遺伝子編集が可能になります。

このような複雑なシステムをモデル化できる最新バージョンの AlphaFold の機能は、AI がこれらのタイプのメカニズムをより深く理解し、治療アプリケーションでの使用を加速するのに役立つことを示しています。

さらに多くの例については、AlphaFold の技術レポートをご覧ください。

科学的探究の進歩

AlphaFold の劇的なパフォーマンス向上は、AI が人体や自然界全体を構成する分子メカニズムに関する科学的理解を大幅に高めることができることを示しています。

AlphaFold はすでに世界中で大きな科学的進歩を促進しています。

次世代の AlphaFold により、人類はバイオメディカル分野で「デジタル」スピードで科学的探究を実施できるようになります。

技術レポートの詳細

DeepMind が発表した技術レポートでは、これらのブレークスルーを実現したテクノロジーと具体的な詳細がさらに詳しく紹介されています。

このネットユーザーは「それだけだ。モデルも論文もコードもない」と若干の失望を表明したが、それでもDeepMindの関係者が発表した技術レポートには詳細かつ興味深い点がいくつかある。

モデルの入力と出力

AlphaFold-latest は、ポリマーの配列、リガンドの SMILES 配列、オプションの共有結合、リガンドの配列位置を含む生物学的アセンブリの説明を入力として受け取り、各重原子の 3D 位置の予測を出力します。

モデルのトレーニングに使用されるすべての実験構造は、リリース日が 2021-09-30 までの PDB からのものです。

モデルに入力されるトークンの数は、許容できるハードウェアと時間のコストによって異なります。ここで、DeepMind は 5,120 個のトークンを使用する複合体でのシステムのパフォーマンスを評価しましたが、このシステムは大量のメモリを備えたアクセラレータでより大きな複合体を実行することが可能です。

各出力構造には、原子ごと、ラベルごとのペア、および集約構造レベルの信頼性が付属しています。さらに、構造内の各エンティティと、構造内のエンティティ間の各インターフェイスには、信頼レベルが関連付けられています。

結果の解釈

数日前、あるネットユーザーが「RNAはいつAlphaFoldの瞬間に到達するのか?」と質問しました。意外にも、彼の願いはすぐに叶いました。

では、最新の AlphaFold はどの程度その要望を満たしているのでしょうか?

AlphaFold-latest は、核酸 (DNA または RNA) の構造を単独で、またはタンパク質と組み合わせて予測できます。

上の図は、AlphaFold-latest と、一般的なタンパク質核酸予測のための最近のディープラーニングベースのシステムである RoseTTAFold2NA (RF2NA) を比較した結果を示しています。

上の図は、現在公開されている CASP15 RNA ターゲットに対する AlphaFold の最先端のパフォーマンスを評価しています。 AlphaFold 最新版は他の自動化された方法よりもパフォーマンスが優れていますが、人間の専門家の介入による現在の最良のシステムよりもパフォーマンスがわずかに劣ります。

——良さそうですね。幸運にも専門家は自分の地位を維持することができました。

技術レポートの他の側面を見てみましょう。

この論文では、2 つのデータセットでリガンドの精度を評価しました。まず、PDB から 428 個のリガンド - タンパク質構造を厳選したコレクションである PoseBusters ベンチマーク セットを調べます。

上の図は、AlphaFold-latest が正確な予測を達成したが、ドッキング ツールの Vina と Gold では達成できなかった 3 つの例を示しています。

従来のドッキング ツールを使用して AlphaFold 2.3 タンパク質構造をドッキングする試みで以前に観察されたパフォーマンスの低さがここで確認されました。代わりに、AlphaFold-latest は、タンパク質とリガンドの位置を共同で予測する場合、これらの結合構造に対して大幅に優れた予測を提供します。

上の画像は、PoseBusters ツールによって返されたさまざまな品質チェックを比較したものです。 AlphaFold-latest は、リジッド ドッキングではなく構造予測を実行するため、リガンドに対応するために周囲の環境のローカルな変更を含む予測を生成する可能性があることに注意してください。

したがって、予測されたリガンドと実際のタンパク質間の矛盾ではなく、予測されたリガンドと予測されたコンテキスト間の矛盾を調べることによって、AlphaFold の最新の予測の分子間妥当性を評価する方が適切です。

上の図は、低相同性の最新 PDB 評価セットにおける AlphaFold-latest と AlphaFold 2.3 のパフォーマンスを比較したものです。

AlphaFold 2.3 との比較では、最大 2560 個のタンパク質残基、最大 20 個のタンパク質鎖、および鎖内の残基が 3 個を超える複合体に制限されます。

最近の低相同性 PDB 評価セットでは、AlphaFold-latest は AlphaFold 2.3 を大幅に上回り、抗体-抗原インターフェース予測が大幅に改善されました。

上の図は、大きな複合体の場合、AlphaFold 最新の単量体タンパク質の予測精度が依然として非常に高いことを示しています。

さらに、AlphaFold-latest は共有結合修飾を含む構造も予測できます。共有結合修飾は、PDB と同じ方法で AlphaFold への入力に表されます。つまり、非標準の CCD コードを持つ残基として定義するか、結合テーブルの追加エントリによって定義できます。

ネットユーザーの間で熱い議論

ネットユーザーは、AlphaFoldが医療と医薬品の分野でさらなる奇跡をもたらすことを期待している。

「AlphaFold は 100,000 ペタフロップスを使用しましたが、ChatGPT 4 は 21,000,000,000 ペタフロップスを使用しました。つまり、AlphaFold が使用する計算量は、GPT 4 が使用する計算量の 0.0005% です。」

これ。 。 。ちょっと皮肉っぽいかな?

AlphaFold のアップグレードは、新しい AI ルールをめぐる激しい議論によって影を潜めている。しかし、人類のより健康で豊かな未来に貢献するものは本当に素晴らしいことであり、それに応じて祝福されるべきです。

約5年前、DeepMindは人体の多くのタンパク質の構造を正確に予測できるAIシステム、AlphaFoldをリリースしました。それ以来、DeepMind はシステムに一連の改良を加えてきました。

現在、最新バージョンの AlphaFold では、タンパク質データベース内のほぼすべての分子の予測を生成できます。

実験は続く。

<<:  チップ設計に特化したNVIDIAが、カスタマイズされた大規模言語モデルChipNeMoをリリース!

>>:  OpenAI がハッカーのグループチャットに潜入!盗まれたChatGPTは「Meow Meow GPT」に置き換えられました、ネットユーザー:まさに伝説的

ブログ    
ブログ    
ブログ    

推薦する

...

ちょっとした機械学習でウェブサイトを高速化

私の人生の 73% は、Web パフォーマンスについて考えています。低スペックの電話で 60 FPS...

...

期待する! 2020年までに中国の人工知能は世界の先進レベルに達するだろう

最近、北京は「科学技術革新の加速と人工知能産業の育成に関する指導意見」を発表し、北京の人工知能発展ス...

シンボリック AI がビジネス運営にとって重要な理由は何ですか?

シンボリック AI は、ビジネスに関する洞察を解釈し、すべての目標の達成を支援します。多くの企業が基...

次元削減アルゴリズムについて: PCA主成分分析

機械学習の分野では、生データから特徴を抽出する際に、高次元の特徴ベクトルが得られることが多いです。こ...

...

...

機械学習における興味深いアルゴリズム 10 選

この記事を通じて、ML でよく使用されるアルゴリズムについて常識的に理解することができます。コードや...

...

教育におけるAIの役割: AIが学習方法をどのように変えるか

教育分野では、人工知能(AI)の適応性が大きな注目を集めています。学習者、教育者、政策立案者はいずれ...

エンタープライズ チャットボットは超パーソナライズされたエクスペリエンスを提供できますか?

エンタープライズ チャットボットは脳死状態です。彼らには認知力も深みもなく、リアルタイムの概念や状況...

ディープフィードフォワードシーケンスメモリニューラルネットワークに基づく大語彙連続音声認識

【51CTO.comオリジナル記事】まとめ本研究では、ディープフィードフォワードシーケンスメモリニュ...

ダンスをしたり、音楽を作曲したり、演出したりできる AI を見たことがありますか?

最近、NVIDIA Blog は「ライト、カメラ、AI: Cambridge Consultants...

小中学生の安全を守るためにロボットは今や欠かせない存在です!

安全性について話すと、誰もが必ずそれに共感します。時代の急速な発展に伴い、人々の個人的な安全がますま...