ちょうど今、コロンビア大学のシステム生物学助教授であるモハメッド・アルクライシ氏が、AlphaFold2 のトレーニング可能な PyTorch 再現バージョンである OpenFold と呼ばれるモデルをゼロからトレーニングしたことを Twitter で発表しました。モハメッド・アルクライシ氏は、これが一般に公開される最初のAlphaFold2の複製品であるとも述べた。 AlphaFold2 は、原子レベルの精度でタンパク質構造を定期的に予測できます。技術的には、多重配列アライメントとディープラーニング アルゴリズム設計を活用し、タンパク質構造に関する物理的および生物学的知識を組み合わせて、予測結果を向上させます。タンパク質構造予測の2/3という優れた成果を達成し、昨年Nature誌に掲載されました。さらに驚くべきことは、DeepMind チームがモデルをオープンソース化しただけでなく、AlphaFold2 の予測データを無料のオープン データセットにしたことです。 ただし、オープンソースだからといって、それが使用可能である、または使いやすいというわけではありません。実際、AlphaFold2 ソフトウェア システムの展開は非常に難しく、ハードウェア要件が高く、データ セットのダウンロード サイクルが長く、必要なスペースが大きいため、一般的な開発者は導入を躊躇します。そのため、オープンソース コミュニティは、AlphaFold2 の使用可能なバージョンを実現するために懸命に取り組んできました。 コロンビア大学のモハメッド・アルクライシ教授らが実装したOpenFoldの総トレーニング時間はA100で約10万時間だったが、約3,000時間で90%の精度を達成した。 OpenFold は、オリジナルの AlphaFold2 と同等か、それよりわずかに優れた精度を備えています。これは、OpenFold のトレーニング セットが少し大きいためと考えられます。 OpenFold の主な利点は、推論速度が大幅に向上することです。タンパク質配列が短い場合、OpenFold の推論速度は AlphaFold2 の 2 倍になります。さらに、カスタム CUDA カーネルを使用することで、OpenFold はより少ないメモリを使用してより長いタンパク質配列を推測できます。 OpenFold の紹介OpenFold は、DeepMind 独自のアブレーション テストでパフォーマンスが低かった非推奨の「モデル アンサンブル」機能を除き、元のオープン ソース推論コード (v2.0.1) のほぼすべての機能を再現します。 OpenFold は、DeepSpeed の有無にかかわらず、完全精度または bfloat16 でトレーニングできます。 AlphaFold2 の本来のパフォーマンスを実現するために、チームは OpenFold をゼロからトレーニングし、モデルの重みとトレーニング データを公開しました。トレーニング データには、約 400,000 個の MSA および PDB70 テンプレート ファイルが含まれています。 OpenFold は、AlphaFold の公式パラメータを使用したタンパク質推論もサポートします。 他の実装と比較して、OpenFold には次の利点があります。
Linuxシステムでのインストールと使用開発チームは、Miniconda をローカルにインストールし、conda 仮想環境を作成し、すべての Python 依存関係をインストールし、2 セットのモデル パラメーターを含む便利なリソースをダウンロードするスクリプトを提供します。 次のコマンドを実行します。 スクリプト/ install_third_party_dependencies.sh 次のコマンドを使用して環境をアクティブ化します。 ソーススクリプト/ activate_conda_env.sh 非アクティブ化コマンド: ソーススクリプト/ deactivate_conda_env.sh アクティブ化された環境でOpenFoldのCUDAカーネルをコンパイルする python3 セットアップ.py インストール /usr/bin に HH-suite をインストールします。 # スクリプト/install_hh_suite.sh OpenFold と AlphaFold のトレーニングに使用するデータベースをダウンロードするには、次のコマンドを使用します。 bash スクリプト/ download_data . sh データ/ DeepMind の事前トレーニング済みパラメータのセットを使用して 1 つ以上のシーケンスに対して推論を実行する場合は、次のコードを実行できます。 python3 run_pretrained_openfold.py \ 詳細については、GitHub をご覧ください: https://github.com/aqlaboratory/openfold さらに読む:
|
<<: 今年の英語大学入試では、CMUは再構成事前トレーニングを利用してGPT3をはるかに上回る134点という高得点を獲得した。
>>: 大学入試結果が続々発表。ボランティア応募で人工知能が注目の選択肢に
[[428372]] [51CTO.com からのオリジナル記事]推奨システムは、登場以来、学界や産...
夢の中で目覚めるという不思議な体験をしたことがありますか?その時点では、周囲に夢があるのを感知できる...
Ascend人工知能産業サミットフォーラムが上海で開催されました。フォーラムでは、ビッグモデルの共同...
【51CTO.com クイック翻訳】 [[341305]] 【はじめに】 GPT-3は1750億個の...
過去 2 年間で、生成型人工知能 (GenAI) の出現により、産業プロセス分析に刺激的な新しい可能...
COVID-19パンデミック以前は、経営幹部は、ビジネス運営の最適化、収益性の向上、イノベーションの...
人工知能が人類を転覆させるのではないかと人々が心配する理由は2つしかありません。1つ目は、ロボットの...
在庫がなければ大晦日もありません。 2020年に日本のAI・ロボティクス分野で起こった出来事をいくつ...
Midjourney は多くの人が使用するグラフィック デザイン ツールです。最近アップデートされた...