「これは、ノーベル賞受賞が期待される最初の人工知能の成果かもしれない。しかし、その画期的な進歩は間違いなく生物学の分野におけるものだ」と、アデレード大学のコンピューターサイエンス教授、シェン・チュンファ氏は、最近人気のアルファフォールドについてディープテックに語った。 AlphaFoldがこれほど注目を集めている理由は、機械学習と生物学を組み合わせ、重要な実際的な問題を真に解決できる成果がほとんどなかったからだと彼は語った。 DeepMind が Nature に発表した論文の初版から判断すると、使用された機械学習アルゴリズムはすべて既存の技術であり、主に畳み込みニューラル ネットワークが使用されています。 センスタイム研究所の研究担当エグゼクティブディレクターであり、知源の若手科学者でもある戴継峰氏は、ディープラーニングの観点から見ると、AlphaFold2は独創的な理論的ブレークスルーではないとDeepTechに語った。これは、現在最高のディープラーニングアルゴリズムと特定のドメイン知識を組み合わせることで、大きなアプリケーションブレークスルーを生み出している。その応用展望は主に構造生物学、つまりタンパク質の三次元構造を試験するための新しい方法を提供することにあります。これまでは、クライオ電子顕微鏡法とX線回折法が主に使用されていましたが、多くの手作業による実験が必要でした。現在、AlphaFold2は以前の2つの方法よりも正確ではないかもしれませんが、多くの費用と人手を節約できます。
図 | AlphaFold によって予測された新型コロナウイルス ORF8 タンパク質の構造が実験的に確認されました (出典: CASP14) 現在、AlphaFold 2の性能は、Fei-Fei Liなどの権威ある人々から賞賛されています。今年の国際タンパク質構造予測コンテスト(CASP 14)では、AlphaFold 2はCASPシリーズのテストで92.4ポイント、最も難しい自由モデリングタンパク質テストで87ポイントを獲得しました。 図 | AlphaFoldは最も難しいフリーモデリングタンパク質テストで87ポイントを獲得しました 「計算能力の向上により、AlphaFoldは短期間で多数の異なるアルゴリズムをテストできるようになった」とカリフォルニア工科大学の博士研究員であるChen Zibo氏はDeepTechに語り、これがAlphaFoldの優れたパフォーマンスの理由の1つだと語った。 結果は確かに印象的ですが、DeepMind はブログで、AlphaFold によって予測された結果は完璧ではないと認めました。この点について、陳淑博氏は「タンパク質の構造を第一原理から予測する方法、構造から機能を予測する方法、タンパク質の構造変化やアロステリック変化を設計する方法など、未解決の問題はまだたくさんあると思う」と述べた。 図 | 青は計算予測、緑は実験結果(出典:deepmind.com) タンパク質の構造を予測するのはどれくらい難しいのでしょうか? 半世紀以上にわたり、学界はこの問題を解決する方法を模索してきました。 1990 年代に、十分なデータと十分な計算能力があれば、機械を使ってタンパク質の構造を予測できるだろうと人々は気づきました。コンピュータが人間とチェスをする例を考えてみましょう。計算能力が向上したため、国際チェスチャンピオンでさえコンピュータに勝つことはできません。その後、囲碁には219×19のバリエーションがあるため、機械は囲碁で人間を超えることはできないと人々は信じるようになりました。 しかし予想外に、わずか10年余りで、GoogleのAlphaGoが世界囲碁チャンピオンのイ・セドルを破った。 AlphaFold は、タンパク質構造を解読し、結晶構造を検証する方法に関するアルゴリズムのトレーニングなど、この方向への人類の追求も表しています。 機械がルールを習得すると、休むことなく作業できるようになり、今日の競技結果につながります。王晨光氏は、これほど大きな話題を呼んだ理由は、バイオメディカル分野で長らく認識され、克服するのが困難であったこの問題が、ついに大きな突破口を開いたからだと述べた。 これまでの参加チームの精度は30~40点程度でしたが、今回のAlphaFoldは人工結晶構造よりもさらに精度が高くなっています。タンパク質構造を予測することの難しさについて、陳子波氏は次のようにも述べた。「主な難しさは、これが非常に複雑なシステムであることです。タンパク質がどのように折り畳まれるかは、その環境(膜タンパク質と細胞内タンパク質など)にも関係しています。」 AlphaFold が登場する前は、科学者は核磁気共鳴、X 線、極低温電子顕微鏡などの技術を通じてのみタンパク質の構造を決定でき、結果を得るには何年もの実験を繰り返す必要があり、また何百万ドルもかかる実験装置を使用する必要もありました。難しいからこそ、タンパク質の構造を予測することの価値はより一層高まります。この技術は先進的であるように見えますが、医療や投薬と切り離せないものです。 一般の人が薬をもっと安く買えるようにできないでしょうか? 王晨光氏はまた、バイオ医薬品分野におけるこの画期的な進歩の重要性は明らかだと述べた。従来の標的薬は主にタンパク質を標的とします。肺がん治療薬を例にとると、EGFRタンパク質を標的とした薬剤は過去20年間にわたって注目されている研究開発テーマです。 AlphaFold は間違いなく製薬分野に役立つでしょう。 多くの薬はタンパク質を標的とするため、タンパク質構造上で薬が攻撃できる場所を探します。したがって、タンパク質の構造がわからない場合、医薬品開発は「まったくの暗闇」になることがよくあります。タンパク質の構造を知ることによってのみ、その表面に基づいていくつかの化合物を意図的に設計することができます。肺がんを標的とした薬であるEGFRを例に挙げてみましょう。薬剤の選択圧により、腫瘍は一定期間後に薬剤に反応しなくなることが多く、後にその原因が遺伝子変異であることが発見されます。遺伝子変異の結果、発現した産物タンパク質のアミノ酸配列が変化することとなります。そのため、この変異タンパク質を標的とした別の薬剤の開発が臨床上必要となっています。 AlphaFold は、変異後のタンパク質の構造を簡単に予測できるはずであり、次世代の新薬の開発に大いに役立つでしょう。さらに、王晨光氏はAlphaFoldの応用に非常に期待しており、医薬品の研究開発に携わる人々は、結晶構造などの専門知識がなくても、AlphaFoldを使用してタンパク質名を入力し、タンパク質構造を視覚的に観察できるため、製薬業界における医薬品の発見プロセスが短縮されると述べました。 製薬会社がより効率的に医薬品を設計できるようになれば、医薬品の開発サイクルもそれに応じて短縮され、医薬品の成分や効能は変わらないまま、医薬品の生産速度が速くなり、一般の人々が購入できる医薬品の価格も下がる可能性があります。 研究者の作業効率を向上させる可能性 図 | 残基がどのようにつながるかの予測 (出典: DeepMind) 王晨光氏は、AlphaFold を使えば、ある程度、静的なタンパク質構造を解読することが以前よりも容易になるが、だからといって学生が努力する必要がなくなるわけではないと述べた。結局のところ、AlphaFold は 100% の精度を達成することはできません。学生がタンパク質の構造を理解したい場合、AlphaFold を使用して予測した後、他の方法でそれを検証する必要があります。しかし、いずれにせよ、AlphaFold によって予測されたパラメータは、タンパク質の結晶構造を解読する上で人類に大きな助けとなる可能性があります。 図 | AlphaFold による 2 つのタンパク質の予測構造と実験的に決定された構造の比較 しかし、王晨光氏は、ほとんどのタンパク質の三次元構造は静的ではなく、常に動的に変化していると考えています。タンパク質は体内で機能を果たす分子として、体内外のさまざまな要因の影響を受け、その構造も変化しています。この変化によってもたらされる複雑さは、従来の方法を使用する場合でも AlphaFold を使用する場合でも、タンパク質分解にとって依然として課題となっています。 AlphaFold の現在の用途にはまだ限界がありますが、この技術的進歩はそれが時間の問題であることを示しています。 コンピュータ アルゴリズムの観点から見ると、最初に公開された AlphaFold バージョンでは、新しいテクノロジはあまり使用されていませんでした。したがって、テクノロジがオープン ソースでなくても、1 ~ 2 か月でアルゴリズムを実装できる博士課程の学生を見つけることは間違いなく可能です。ただし、AlphaFold のディープラーニング モデルの最初のバージョンは、関連する構造を復元できるかどうかを判断するため、非常に重要です。 実際、AlphaFold の最初のバージョンのパフォーマンスは比較的平均的でした。CASP 13 コンテストで 1 位を獲得したものの、センセーションを巻き起こすことはありません。第2版では大幅に改良され、その精度は実験室で作られた3次元構造の予測結果とほぼ同じです。 Google のようなテクノロジー企業が、生物学的にこれほど素晴らしい成果を上げたことは驚くべきことではありません。 AlphaFold の開発元である DeepMind は Google に買収され、現在も独立して運営を続けています。 DeepMind は創業以来、いくつかの実用的な問題を解決するために、ディープラーニング、特に強化学習に多大なエネルギーを注いできました。 さらに、Google はインターネットに取り組んでいるだけでなく、健康や医薬品のイノベーションにも取り組んでいます。なぜなら、常に次の成長ポイントを探す必要があるからです。AlphaFold チーム自体が AlphaGo チームであり、さらに Google は資金を投入する意思があるため、それが実現できるのです。一般的な大学がそのような大規模な計算能力、ビッグデータ、大規模なチームを持つことは難しいため、大学でそのような成果を生み出すことはますます困難になっています。 陳梓波氏はまた、一般に信じられていることとは反対に、大企業はあらゆる関係者の力を結集できるため、研究機関よりも優れたリソースを持っていることが多いと述べた。学術界で、DeepMind のように業界をリードする人物をこれほど多く惹きつける研究室を見つけるのは難しいでしょう。 |
<<: アルゴリズムが消費者を「計算」するのを防ぐにはどうすればよいでしょうか?専門家:対策のためのアルゴリズムの研究は可能
>>: ボストン・ダイナミクスのロボットダンス動画が世界的ヒット!エンジニアリング担当副社長が明かす:私たちは古典と最先端の技術を組み合わせています
国際的に有名な学術組織である IEEE 国際データマイニング会議 (ICDM) は、データマイニング...
毎年恒例のテクノロジー業界のオープニングショー「CES」が現在、米国ラスベガスで開催されています。 ...
今日では、盗作された記事や作品が出版され、盗作者がそれを無料で使用したり、利益を得たりすることは珍し...
序文人工知能ブームは世界中を席巻し、数え切れないほどの人材が人工知能業界に集まっています。機械翻訳、...
絶滅危惧動物を研究する上で最大の課題の一つは、その数を正確に推定することであり、各個体を追跡して詳細...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
MarketsandMarketsが発表した最新の市場調査レポートによると、人工知能ロボット市場は2...
AIoT とは何ですか? 何ができるのでしょうか? これらは、今日の記事で取り上げる質問です。本質的...
MITテクノロジーレビューは毎年、その年の「トップ10のブレークスルーテクノロジー」を選出していま...
人工知能の概念の普及に伴い、サービスロボット業界も近年ますます注目を集めています。資本市場のサービス...
12月1日、アリババクラウド同義千文の720億パラメータモデルQwen-72Bがオープンソース化され...
11月3日、2019年テンセントサイエンスWEカンファレンスで、世界中の科学者が細胞治療、脳チップ、...