アストラゼネカはPyTorchベースのアルゴリズムを使用して新薬を発見

アストラゼネカはPyTorchベースのアルゴリズムを使用して新薬を発見

[51CTO.com クイック翻訳] Facebookの機械学習フレームワークPyTorchは、2017年の発売以来、イーロン・マスクの自動運転車のサポートからロボット農業プロジェクトの推進まで、幅広い用途で活用されてきました。

今回、製薬会社 AstraZeneca は、社内のエンジニアリング チームが PyTorch を活用して、医薬品の発見を簡素化し、スピードアップしていることを明らかにしました。

AstraZeneca のテクノロジーは、PyTorch と Microsoft Azure Machine Learning を組み合わせて、大量のデータを精査し、薬剤、疾患、遺伝子、タンパク質、分子間の複雑な関係性に関する新たな洞察を獲得します。

この理解はアルゴリズムに入力するために使用することができ、その結果、科学者が研究室でテストするための特定の病気に対する多くの薬剤ターゲットを推奨できるようになります。

このアプローチは、これまでは費用と時間のかかる試行錯誤の方法に基づいていた創薬などの分野で大きな進歩を促進する可能性があります。

病気を治療するための新薬を開発するには、科学者は通常、実行可能な解決策が見つかるまで研究室でさまざまなタンパク質の設計と組み合わせをテストします。そのため、薬が設計されてから市場に出るまでに 10 年から 15 年かかります。一方、アストラゼネカのアルゴリズムは、科学者が特定の病気に対して探すべき上位 10 の薬剤ターゲットをより迅速に特定できます。

創薬に自動化を適用することは、科学者が研究の実施に役立てるためにアクセスできるデータの量が毎年劇的に増加しているため、特に有用です。日々拡大するデータベースを分析して、それが新薬の発見にどのように役立つかを理解することは、事実上超人的な仕事になっています。

「研究者が利用できる科学情報とデータの量は毎年増えています」と、アストラゼネカの機械学習エンジニア、ギャビン・エドワーズ氏は ZDNet に語った。「PyTorch や Azure などの AI と機械学習ツールを活用することで、複数のソースから情報を素早く抽出、統合、解釈し、手動でデータを分析するよりも早く、より正確な科学的結論に到達することを目指しています。」

利用可能なデータの多くは非構造化テキストであるため、PyTorch が役立ちます。 Facebook が開発したこのパッケージは、Python プログラミング言語をベースにしており、コンピューター ビジョンや自然言語処理 (NLP) などの分野で集中的なデータ サイエンス タスクに取り組む開発者にとって特に便利なオープンソースの機械学習ライブラリです。

AstraZeneca の NLP チームは、PyTorch を使用して、データを横断し、パターンと傾向を探し、最終的に利用可能な情報の構造を決定するバイオメディカル テキスト マイニング アルゴリズムを定義およびトレーニングします。

次に、データはナレッジ グラフに入力され、情報の断片がインテリジェントに接続されて、各データ ポイントをコンテキスト内で調査できるようになります。グラフは情報ネットワークのように使用され、各データ(遺伝子、タンパク質、疾患、化合物)の属性だけでなく、異なるカテゴリ間の関係も反映されます。

言い換えれば、ナレッジグラフは利用可能なすべての科学データを包括的に整理します。その後、アストラゼネカのエンジニアは Microsoft Azure Machine Learning の計算能力を活用し、ナレッジ グラフを使用して、科学者に新しい薬剤ターゲットを推奨するアルゴリズムをトレーニングしました。

「私たちは、パブリックドメインの研究と社内の研究を、複雑な情報を簡単にエンコードできるグラフに組み合わせています」とエドワーズ氏は言う。「これに機械学習を加えることで、新しい薬剤ターゲットを推奨し、パイプラインの決定に役立つ機械学習モデルをトレーニングできます。」

研究室で休みなく新しい薬剤の設計に取り組んでいる科学者にとって、薬剤発見のための推奨アルゴリズムは確かに大きな時間節約になると思われます。しかしエドワーズ氏と彼のチームは、彼らが作成しているナレッジグラフが、研究者が新しいつながりを見つけたり、新しい道を模索したり、時間を無駄にすることなく証明されていない理論をテストしたりするのに役立つことも期待しています。

ナレッジ グラフは、ズームアウトして問題の 1 つの側面を詳細に確認したり、拡大してさまざまな研究分野にわたるより広い視野を提供したりできます。その結果、研究者はプロジェクトにさらなる価値をもたらす未活用の情報に簡単にアクセスできるようになります。

「私たちのナレッジグラフにより、研究者は遺伝子、病気、薬、安全性情報について重要な質問をして、薬物ターゲットを特定し優先順位をつけることができます」とエドワーズ氏は語った。「そして、データと知識が増えるにつれて、グラフも大きくなります。つまり、新しい試験はそれぞれ、以前に学んだことの恩恵を受けることになります。」

エドワーズ氏にとって、この技術の応用範囲は広範囲に及ぶ可能性がある。世界的な流行が続く中、これは間違いなく朗報です。

原題: AstraZeneca は PyTorch を利用したアルゴリズムを使用して新薬を発見、著者: Daphne Leprince-Ringuet

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  機械学習タスクオーケストレーションツールの比較

>>:  「新世代人工知能」の10の応用シナリオが北京宜荘に上陸

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

2023年以降を一変させる5G IoTテクノロジートップ10

IoT 分野の拡大と発展により、多くの変革的テクノロジーがもたらされるでしょう。家庭から自動車、ウ...

GPT-3.5 を選択すべきでしょうか、それとも Llama 2 などのオープンソース モデルを微調整すべきでしょうか?総合的に比較した結果、答えは

GPT-3.5 の微調整には非常にコストがかかることはよく知られています。この論文では、手動で微調整...

無人運転は地方で大きな発展の可能性を秘めている

農業人口の高齢化と低所得化により、牛による耕作、手作業による移植、手作業による収穫といった伝統的な農...

Nvidiaの次世代GPUが発表、H100を超える!最初の3nmマルチチップモジュール設計は2024年にデビュー予定

3nmプロセス、H100をはるかに超える性能!つい最近、海外メディアのDigiTimesが、コードネ...

コンピュータビジョンを学ぶための81ページのガイド

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

究極の「公開」: GPT-4 モデルのアーキテクチャ、トレーニング コスト、データセット情報がすべて公開されます

GPT-4 のモデルアーキテクチャ、インフラストラクチャ、トレーニングデータセット、コストなどの情報...

2つのセッションでは人工知能技術が注目を集めました。AI技術はこれらの業界で導入されています

近年、人工知能がブームを迎えており、人々は合理的な分析と思考を通じて、人工知能の波をどのように利用し...

JavaScript における一般的なソートアルゴリズムの詳細な説明

諺にこうあります:雷鋒が雷鋒塔を倒し、Java が JavaScript を実装します。 Java ...

LangChain の実践: 大規模言語モデルのコードベースの理解

著者 | 崔昊レビュー | ChonglouまとめLLM(大規模言語モデル)の開発に伴い、ソースコー...

自然言語処理パート1: テキスト分類器

[[194511]]序文テキスト分類は、自動記事分類、自動メール分類、スパム識別、ユーザー感情分類な...

ACM 発表: 2017 年チューリング賞はチップ業界の巨匠 2 名に授与される

米国計算機協会(ACM)は、2017年のチューリング賞を、チップ業界の巨匠2名、スタンフォード大学元...

「ロボットツアーガイド」の導入により、観光体験に斬新さが加わる

近年、科学技術の進歩に牽引され、知能ロボットは目覚ましい発展を遂げています。チップ、視覚システム、セ...

GitHub ホットリスト 1 位: 数百万のトークン コンテキスト、動画も生成可能、カリフォルニア大学バークレー校制作

今日の GitHub ホット リストのトップは、最新のオープン ソース ワールド モデルです。コンテ...

...

Python でシンプルなニューラル ネットワークを作成する方法 (コード付き)

[[251984]]ニューラル ネットワークの仕組みを理解する最良の方法は、自分でニューラル ネッ...