新しい研究:医療AIが新たな統合失調症患者の治療効果をほぼ盲検で評価

新しい研究:医療AIが新たな統合失調症患者の治療効果をほぼ盲検で評価

1月12日、新たな研究により、統合失調症患者の治療で医師を支援するために使用されるコンピューターアルゴリズムは、開発過程で見たことのない新しいデータにうまく適応できないことが判明した。したがって、このタイプの医療用人工知能は、これまで治療したことのない患者の治療結果を評価する際には、パフォーマンスが非常に低くなります。

これらの医療ツールは、人工知能を使用して大規模なデータセット内のパターンを発見し、個人が特定の治療にどのように反応するかを予測します。これは、精密医療の中核をなすものです。医療専門家は、このツールを使用して各患者に合わせた治療計画をカスタマイズしたいと考えています。サイエンス誌に掲載された記事の中で、研究者らは、AIモデルがトレーニングサンプル内の患者の治療結果を高い精度で予測できると指摘した。しかし、これまで見たことのない患者のデータを処理すると、モデルのパフォーマンスは大幅に低下し、ランダムな推測よりもわずかに優れている程度になりました。

精密医療の有効性を確保するには、予測モデルがさまざまな状況下で安定した精度を維持し、偏りやランダムな結果の可能性を最小限に抑える必要があります。

「これは人々がまだ気づいていない大きな問題だ」と、コネチカット州ニューヘイブンにあるエール大学の精神科医で、この研究の共著者であるアダム・チェクロード氏は言う。 「この研究は基本的に、アルゴリズムはまだ複数のサンプルでテストする必要があることを示しています。」

アルゴリズムの精度

研究者らは精神病予測モデルで一般的に使用されるアルゴリズムを評価した。研究者らは、北米、アジア、ヨーロッパ、アフリカで統合失調症と診断された1,513人のボランティアを対象にした抗精神病薬の臨床試験5件のデータを使用した。 2004年から2009年にかけて実施されたこの試験では、3種類の抗精神病薬のうち1種類を服用する前と服用4週間後のボランティアの症状を測定した。

研究チームはデータセットを使用して、抗精神病薬による治療を4週間受けた後に患者がどの程度回復するかを予測するアルゴリズムをトレーニングした。まず、研究者らは、アルゴリズムが開発された実験でその精度をテストし、予測と実験で記録された実際の効果を比較して、高い精度を確認しました。

その後、さまざまな方法を使用して、新しいデータを分析する際の AI モデルの精度を評価しました。研究者らは臨床試験のデータのサブセットでモデルをトレーニングし、それを同じ試験の別のデータのサブセットに適用した。また、試験または試験グループのすべてのデータを使用してアルゴリズムをトレーニングし、追加の臨床試験データでモデルのパフォーマンスをテストします。

AI モデルはこれらのテストでパフォーマンスが低く、トレーニングされていないデータ セットに適用すると、モデルによって生成された予測がほぼランダムであることが判明しました。研究チームは異なる予測アルゴリズムを使用して実験を繰り返したが、同様の結果が得られた。

より良いテスト

研究の著者らは、この研究結果は、臨床予測モデルの信頼性を確保するには大規模なデータセットで厳密にテストする必要があることを浮き彫りにしていると述べている。精神医学的成果に関する 308 の臨床予測モデルを体系的にレビューした結果、開発に使用されたサンプル以外のデータセットで検証されたモデルは約 20% のみであることがわかりました。

「モデル開発は医薬品の開発のように考えるべきだ」とチェクロード氏は語った。多くの薬は初期の臨床試験では良好な結果を示すものの、後の段階で問題が生じると彼は説明した。 「こうしたアルゴリズムの開発とテストの方法については、非常に厳格にならなければなりません。一度やってみて、それが正しいと考えることはできません。」

<<:  生成AIはスマートホームの触媒となる

>>:  大規模言語モデルの脆弱性緩和ガイド

ブログ    
ブログ    
ブログ    

推薦する

AI アシスタントの人気が高まっていますが、次に購入するスマートフォンはなぜ電話なのでしょうか?

大きな模型ブームが到来し、アイアンマンのジャービスが最も忙しい「マーベルヒーロー」(手動の犬の頭)に...

人工知能におけるGNNとは何ですか?

グラフディープラーニング(GDL)は有望な研究分野であり、グラフデータに基づいた学習や分析は非常に有...

手書き認識のための単層基本ニューラルネットワーク

[[214992]]まず、コードテンソルフローをインポートする tensorflow.example...

ディープラーニング プラットフォームとして、TPU、GPU、CPU のどれが優れているでしょうか?誰かがベンチマーク調査を行った

GPU、TPU、CPU はすべてディープラーニング モデルのトレーニングに使用できますが、これらの各...

COVID-19により公益事業の人工知能への移行が加速

人工知能 (AI) は、医療から自動車、小売、ファーストフードまで、考えられるほぼすべての業界で幅広...

データ構造とアルゴリズム: 奇数偶数による配列のソート II

[[429517]]簡単なシミュレーション問題、ぜひ挑戦してみてください!配列を偶数/奇数でソート...

Lightning AI Studioを無料で使う方法

翻訳者 |ブガッティレビュー | Chonglouこの記事では、無料で使いやすい新しいクラウドIDE...

TensorFlow の基礎から実践まで: 交通標識分類ニューラル ネットワークの作成方法を段階的に学習します

[[198754]] TensorFlow は、最も人気のあるディープラーニングフレームワークになり...

ガートナー:持続可能性とデジタル主権がパブリッククラウドベースのAIサービスを選択する際の最重要基準となる

ガートナーは、2027 年までに、生成型人工知能 (生成型 AI) を導入する企業の 70% が、持...

産業用ロボットの開発動向

産業用ロボットは、さまざまな産業用タスクを自動的に実行できる一種の機器として、製造、組み立て、梱包、...

最高年収は約56万! 2023年の最新のAIGC雇用動向レポートが発表されました

言うまでもなく、ChatGPT が過去 6 か月間でどれほど人気が​​あったかは誰もが知っています。...

OpenAIの「コピー&ペースト」の背後にあるのは、盗作者が全てを無料で手に入れたいということ

今日では、盗作された記事や作品が出版され、盗作者がそれを無料で使用したり、利益を得たりすることは珍し...

TensorFlow が素晴らしい機械学習データセット 30 選

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

「幻想」を消し去れ! Google の新しい ASPIRE メソッドにより、LLM は自己採点が可能になり、その効果はボリューム モデルよりも 10 倍優れています。

大規模モデルの「幻覚」問題は解決されつつあるのでしょうか?ウィスコンシン大学マディソン校とグーグルの...

...