ChatGPTを使用して小児疾患を診断しますか?新たな研究がこれに冷水を浴びせる:正解率はわずか17%

ChatGPTを使用して小児疾患を診断しますか?新たな研究がこれに冷水を浴びせる:正解率はわずか17%

1月4日、ニューヨークのコーエン小児医療センターの3人の小児科医が、大規模言語モデルChatGPTの小児疾患診断能力を評価したが、結果は期待外れだった。彼らは ChatGPT にランダムに選んだ小児科の症例 100 件を診断してもらったところ、その精度はわずか 17% であることがわかりました。 IT Home は、この研究が権威ある雑誌 JAMA Pediatrics に掲載されたことに気づきました。

研究者らは、小児の診断は患者の症状全体を考慮するだけでなく、年齢も考慮する必要があるため、特に難しいと指摘している。近年、大規模言語モデルは潜在的な医療診断ツールとして注目されるようになっています。その実用性を評価するために、研究者らはランダムに小児症例を 100 件収集し、ChatGPT に診断を依頼しました。

操作を簡素化するために、研究者は同じ方法を使用して各ケースで ChatGPT に質問しました。彼らはまず症例のテキストを貼り付け、次に「鑑別診断」と「最終診断」をするよう求められました。鑑別診断とは、患者の病歴と身体検査に基づいて考えられる診断の予備リストであり、最終的な診断は患者の症状の最も可能性の高い原因となります。

ChatGPTの回答は、研究に参加していない2人の小児科医によって採点され、「正解」、「不正解」、「不完全な診断」に分類されました。研究チームは、ChatGPT が「正しい」と評価した回答は 17 件だけであり、そのうち 11 件は正しい診断に臨床的に関連しているにもかかわらず、誤りであったことを発見しました。

研究者らは、ChatGPTはまだ明らかに診断ツールではないが、より的を絞ったトレーニングによってその精度は向上する可能性があると述べている。さらに、将来的に改良されれば、ChatGPT は文書の整理、研究論文の執筆支援、患者への術後ケアガイドラインの提供などの補助ツールとして使用できる可能性があると示唆しています。

<<:  AIを活用して衛星画像を判別、世界初「全世界の船舶足跡マップ」を公開

>>:  超リアル!リアルタイムの高品質レンダリング、ダイナミックな都市シーンモデリングのためのストリートガウス分布

ブログ    

推薦する

ファーウェイ成都インテリジェントボディー人工知能サミットフォーラムが成功裏に開催され、ファーウェイは成都の「スマートで美しい成都」の構築を支援

デジタル経済の時代において、クラウド、5G、AI、ビッグデータ、人工知能などの新技術が社会の生産要素...

ChatGPTのサプライチェーンへの応用の可能性

IT ソリューション プロバイダーの Manhattan Associates のマネージング ディ...

ディープラーニング GPU の最も包括的な比較: コスト パフォーマンスの点で最も優れているのはどれですか?

AI に関して言えば、「GPU の混乱」を感じない人はいないでしょう。 Tensor コア、メモリ...

「初の常温常圧超伝導体」に対する共同研究者の反応:内容に欠陥あり

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Go データ構造とアルゴリズムの基本クイックソート

[[411577]]この記事はWeChatの公開アカウント「Light City」から転載したもので...

...

AIディープフェイク技術の2つの側面

著者 | 李世馨翻訳者 | 朱 仙中編纂者:Qianshan人工知能に関する議論にはしばしば論争が伴...

...

大国間の競争の焦点:人工知能とデジタル主権

​​報告書は、経済の分離と地政学的な二極化が進む時代に、優れたデジタルまたはスマートなパートナーシッ...

...

...

顔認識はアニメーションには効果がない、ディズニーはアニメーション専用の顔認識ライブラリを作成

アニメーションといえば、1923年に設立された企業帝国、ディズニー。アニメーション会社としてスタート...

NatureがAIGC禁止令を発令!ビジュアルコンテンツにAIを使用した投稿は受け付けられません

最も権威のある科学雑誌の一つであるネイチャー誌は最近、明確な声明を発表しました。 生成型人工知能 (...

コードを入力せずに機械学習を行うことはできますか?アマゾンウェブサービスが今回大きな動きを見せた

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...