データアーキテクチャはAIと医療の未来を推進する上で重要

データアーキテクチャはAIと医療の未来を推進する上で重要

COVID-19パンデミックは、医学的発見のスピードの重要性だけでなく、その加速を支援するデータサイエンスと人工知能の重要性も浮き彫りにしました。例えば、近年、医療分野における機械学習の応用は大きく進歩しており、人工知能によって発見された薬物分子が人間の臨床試験に利用されるようになりました。しかしながら、英国のアラン・チューリング研究所が最近発表した調査報告書によると、さまざまなシステムによるデータの収集、使用、保存、処理、統合の難しさ(つまり、強力なデータアーキテクチャの欠如)が、COVID-19パンデミックに対応するための人工知能ツールの導入の取り組みを妨げていることが示唆されています。

人工知能の可能性を最大限に引き出すには、企業、特に医療機関や製薬メーカーがデータを整理する必要があります。

データはますます重要になってきている

多くの医療機関や製薬会社が新薬や医療の発見、特に新型コロナウイルスの開発に多大な努力を払ってきたが、それは長く複雑で費用のかかるプロセスである。成功率が低いのは言うまでもありません。調査によると、医薬品開発全体の失敗率は 96% にも上ります。ここでデータが重要な役割を果たす可能性があり、失敗率を減らすために医薬品開発の可能性を高めるための最新のアプローチが必要になります。

ヒトゲノムデータがなければ、疾患に寄与するすべての要素を完全に把握することは不可能であり、それによってより広く深い理解を得ることはできません。これには、主要な遺伝子変異の発見と検証を可能にするための大規模なゲノム配列解析が必要です。収集された情報と洞察が多ければ多いほど、企業はより情報に基づいた行動をとり、医薬品開発の失敗率を減らすことができます。このデータを使用して機械学習アルゴリズムを作成すると、医薬品開発パイプラインを自動化し、医薬品の発見を加速することもできます。

別の例として、QSAR(定量的構造活性相関)モデルは、合成する薬物化合物の数を減らすことで新しい化学構造の予測精度を向上させ、コストと時間を削減することができます。予測分析は、豊富な履歴データから得た知識を伝達し、学習を組み込むことで、医薬品の開発や製造にも使用できます。このデータは、新薬の発見や実験のスピードアップに活用できます。

人工知能はすでに医薬品の開発、発見、臨床試験のプロセスにおいて重要な役割を果たしており、研究機関に最新のデータと分析方法を通じて臨床研究を加速する機会を提供しています。

データの課題

こうした進歩にもかかわらず、このデータを分析するには独自の課題があります。現在、非常に多くの生物学的データや医学的データが利用可能になっているため、必要な洞察を迅速に得ることはこれまで以上に困難になっています。このデータは適切に使用されなければ意味がありません。さらに、特にゲノムデータは、大量のストレージとそれを分析するための特殊なソフトウェアを必要とし、データ管理、データ共有、プライバシーとセキュリティに関する多くの問題を引き起こします。これは、多くの場合、非常に機密性の高い個人情報であることを覚えておくことが重要です。

研究機関やメーカーが直面している問題は、こうしたデータが非常に断片化されていることが多く、従来のアーキテクチャを使用してこれほど多くの異なるデータの分析をサポートすることが難しいことです。分析に適したデータを見つけるだけでも数週間かかることがあります。

バイオテクノロジー開発企業 Regeneron はこれらの問題に直面し、処理パフォーマンスとスケーラビリティの問題に対処するために取り組みました。同社が直面していた問題は、データ チームに、利用可能なペタバイト単位のゲノムおよび臨床データを分析するために必要なリソースがなく、収集したデータを十分に活用できなかったことです。これまで以上に多くのデータを収集できるようになりましたが、同時に、これらの膨大なデータセットを処理するのにも苦労しています。

データアーキテクチャの役割

ここで、データ レイクハウスが重要な役割を果たすことができます。医療機関にとって、生産性と成功の可能性を高めるには、インフラストラクチャと運用を合理化することが重要です。データは、Lakehouse などの統合され簡単にアクセスできるデータ分析プラットフォームにすべて集中化されている場合にのみ、その潜在能力を最大限に発揮できます。簡素化されたレイクハウス インフラストラクチャにより、スケーラビリティ、自動化、機械学習を大規模に実現し、医薬品開発を加速できます。統合プラットフォームにより、インタラクティブなワークスペースを作成して、医薬品ライフサイクルのすべての段階で透明性とコラボレーションを向上させることもできます。信頼性を確保し、機密データを保護するためのセキュリティを維持しながら、データと洞察をチーム間で簡単に共有できます。したがって、薬剤や治療法をより早く発見するためには、全体的な薬剤ターゲットの特定を加速し、開発チームが複数の疾患領域に同時に取り組むことができる必要があります。

一方、レガシー アーキテクチャや複雑なインフラストラクチャに対処するには、特に適切なインフラストラクチャをセットアップし、必要な分析をサポートするためにそれを維持するのに時間がかかります。これにより、開発チームが分析に集中することが難しくなります。システム障害が発生した場合にクラスター管理などの操作を自動的に切り替えるなどの自動化が強化されることで、チームは DevOps に費やす時間を減らし、医薬品の開発や新しい治療法の発見など、より価値の高いタスクに集中できるようになります。 Regeneron 社がより堅牢なデータ アーキテクチャを提供する新しいプラットフォームを採用した結果、分析に適したデータを見つけるのにかかる時間が 3 週間から 2 日に短縮され、より幅広い研究をサポートできるようになりました。したがって、データ アーキテクチャは、データを使用可能にし、医薬品の発見を改善する質問に答えられるようにするための鍵となります。

Lakehouse プラットフォームでは、臨床予測とデータ系統へのアクセスが可能になるだけでなく、研究者は再現可能な機械学習ベースのシステムを活用して仮説を生成および検証できるため、時間と研究に関してより的を絞った意思決定を行うことができます。

データの可能性を実現する

データはヘルスケア業界、特に医薬品や医療の発見において重要な役割を果たしていますが、企業はデータの潜在能力を最大限に活用するためにこれをさらに推進する必要があります。強力なデータ アーキテクチャがなければ、新薬発見などの活動における高い失敗率はすぐには低下しません。一元化されたスケーラブルなプラットフォームで業務を合理化することで、企業は必要な洞察を得て、新薬発見を加速できます。データを整理することは最初のステップに過ぎません。次のステップは、必要なデータ アーキテクチャを確立することです。

<<:  2022年、AIネットワーク管理が信頼を高める

>>:  高度な自動運転システムの開発において解決すべき課題についてお話しします

ブログ    

推薦する

...

...

多様性がAI戦略の成功の鍵となる理由

機械学習と人工知能に関しては、スキャンダルが後を絶ちません。過去数ヶ月、マイクロソフトのジャーナリス...

ソフトウェア配信における機械学習の活用方法

現代のほとんどのソフトウェア チームにとって、ソフトウェアの配信は継続的なプロセスです。ソフトウェア...

...

機械学習により整形外科画像分析がさらに進化

医療画像解析に機械学習 (ML) を実装することは新しいことではありません。放射線科医は、自動化ツー...

AlphaFold2 の原理: 注意メカニズムが畳み込みネットワークに取って代わり、予測精度が 30% 以上向上

[[412540]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

MITの新しいAI研究:セーターが編めなくても問題ない、AIにやらせればいい

人工知能といえば、最先端のクールなアプリケーションのほかに、この話題になると「偽物」という言葉が思い...

「人工太陽」が正確に放電します! DeepMind、AI制御の核融合で新たなブレークスルーを達成

AI制御の核融合はもうすぐ実現します。ディープマインドは3年間の秘密の研究開発を経て、昨年、AIを使...

言語学からディープラーニングNLPまで、自然言語処理の概要

この記事は、2 つの論文から始まり、自然言語処理の基本的な分類と基本概念を簡単に紹介し、次にディープ...

...

Google Gemini がゲームを逆転!マルチモーダル機能は GPT-4V と同等 | 香港中国語 128 ページの総合評価レポート

Google がゲームを撤回しました! Gemini が API を公開してから1 週間も経たないう...

...

PyTorchの基本操作の詳細な説明

[[406246]] PyTorch とは何ですか? PyTorch は、最大限の柔軟性と速度を備え...