【新知能紹介】中国内外の科学者71人が共同で、検査結果を検知し、医師と同じくらい正確に子どもの病気を診断できるAIシステムを開発した。正確率は一貫して、プライマリケア小児科医の正確率と同等か、それよりも優れていました。中国の研究チームが、テキストベースの電子カルテ(EMR)に基づく臨床インテリジェント診断のためのNLP技術の利用に関する研究結果をトップクラスの医学雑誌に発表したのは今回が初めてです。 私たちの研究者はまた大きな成功を収めました! 昨日、ネイチャーの関連雑誌『メディシン』が「人工知能を使って小児疾患を評価し、正確に診断する」という大ヒット記事を掲載し、業界に大きな波紋を巻き起こした。 中国の研究チームが、テキストベースの電子カルテ(EMR)に基づく臨床インテリジェント診断のための自然言語処理(NLP)技術の使用に関する研究結果をトップクラスの医学雑誌に発表したのは今回が初めてです。 この人工知能プログラムは、検査結果、健康記録、さらには手書きのメモを調べることで、医師と同じくらい正確に小児疾患を診断することができます。 インフルエンザや喘息から命に関わる肺炎や髄膜炎まで、このシステムは一貫してプライマリケア小児科医の精度に匹敵するか、それを上回りました。
ネイチャー誌はプレスリリースでこう述べた。 この技術はちょうど良いタイミングで登場したのかもしれない。近年、病気、診断検査、治療の選択肢の範囲が飛躍的に拡大したため、医師の意思決定プロセスはより複雑になっています。 しかし、バーミンガム大学の工学教授ドゥック・ファム氏はこう語った。 結果から判断すると、このシステムは確かに若手医師よりも優れたパフォーマンスを発揮しますが、臨床医に完全に取って代わることは決してできません。トレーニング例をいくつ使用しても、100% 正しい結果が保証されるわけではありません。 この記事の著者の一人である張康教授も、「医師とAIの関係は、人間の運転手とその監督下にある自動運転車との関係に例えることができる。医師はより短時間で低コストでより良い治療を行えるようになるだけだ」と述べている。 人工知能(AI)ベースのアプローチは、ヘルスケアを変革する強力なツールとなっている。機械学習分類器 (MLC) は画像ベースの診断において強力なパフォーマンスを発揮していますが、さまざまな大規模な電子健康記録 (EHR) データの分析は依然として困難です。 ここで著者らは、MLC が医師が使用する仮説的演繹的推論と同様の方法で EHR を照会し、従来の統計的手法では見逃されていた関連性を発見できることを示しています。著者らのモデルは、ディープラーニング技術を使用した自動化された自然言語処理システムを採用し、EHR から臨床的に関連する情報を抽出します。 大規模な紹介センターに通う 1,362,559 人の小児患者から合計 1 億 160 万のデータ ポイントが分析され、フレームワークのトレーニングと検証が行われました。 小児診断フレームワークのワークフロー図 まず、データが抽出され、ディープラーニングに基づいて NLP モデルが構築され、データが意味的に分析されます。次に、データが構造化されます。最後に、これらの完全に構造化されたデータベースが疾患分類器で処理され、臨床診断を予測します。 大規模小児コホートにおける診断フレームワークの階層: 階層ロジスティック回帰分類器を使用して解剖学に基づく診断システムを開発する 臓器アプローチに基づいて、臓器系はまず、呼吸器疾患、全身性疾患、神経精神疾患、泌尿生殖器系疾患、および胃腸疾患の 5 つのカテゴリに分類されます。それぞれの大まかなカテゴリは、臓器サブシステムとさらに具体的な診断グループに分類されます。 下線はコンピューターが予測した診断で、一番上の1行目に医師の診断結果が表示されます。 診断階層の最初のレベルでは、分類器は多数の小児患者の臓器系にどのような広範な解剖学的カテゴリが存在するかを正確に識別します。次に、診断階層の第 2 レベルで、呼吸器疾患の診断を例に挙げてみましょう。 呼吸器疾患の診断では、分類器は上気道疾患と下気道疾患を区別することができます。 上気道内では、最も一般的な急性上気道感染症である副鼻腔炎と喉頭炎をさらに区別することが可能であり、診断精度はどちらも 95% 以上です。 喘息は呼吸器系内の別のカテゴリーに分類され、診断システムでは、合併症のない喘息、咳喘息、急性喘息増悪を正確に区別しました。 人間の医師が診断した315,661件の主要な呼吸器疾患のうち、AIは92%の精度で295,403件を正確に予測することができた。 F1スコアを使用して、さまざまなグループ(行)の診断パフォーマンスを評価します(ルートは診断分類の最初のレベルです) 表の2列目はAIの診断結果です。続くグループ1と2は若手医師の診断結果、残りの3グループは3人のベテラン医師による診断結果です。 ご覧のとおり、機械学習モデルのパフォーマンスは、経験の浅い医師グループよりも優れていましたが、経験豊富な 3 つの医師グループよりもわずかに劣っていました。 AI診断システム手法の紹介データ収集 私たちのデータは、広州女性小児医療センターの小児患者 567,498 人に対する外来診察 1,362,559 件の電子医療記録から収集されました。期間は2016年1月から2017年7月までです。患者の平均年齢は2.35歳で、40.11%が女性でした。私たちは、広東省の増城婦人小児病院の独立した小児患者の医療記録 11,926 件を使用して、AI システムのパフォーマンスを人間の医師のパフォーマンスと比較しました。 NLPモデル構築 私たちは、電子カルテの生データから重要な概念と関連カテゴリを抽出するための生情報抽出モデルを構築し、クエリと回答の組み合わせという新しい形式で臨床データに変換しました。このデータは関連する症状をグループ化し、モデルが診断を行うために依存している正確な特徴を表すことで解釈可能性を向上させます。 3 人の医師が、患者の訴え、現在の病歴、身体検査、臨床検査レポートを含むモデルを計画し、検証しました。 自然言語処理のための情報抽出モデルの設計 NLP フレームワークには、語彙構築、トークン化、単語埋め込み、グラフ構築、LSTM アーキテクチャを使用した文分類など、複数のコンポーネントがあります。 辞書構築 トレーニング データ内の文章を読み取り、クエリ回答モデルの構築に使用する臨床的に関連する単語を選択して、語彙集を生成しました。辞書のキーワードは当社の医師によって選別され、中国の医学辞書を使用して生成されています。次に、医師の臨床知識と経験、および専門家の合意に基づいて辞書の誤りが修正されました。既存の病気や身体検査に対して新しい概念が見つからなくなるまで、プログラムは繰り返し実行されます。これらの文は、単語埋め込みモデルのトレーニングに使用されます。 建築デザイン スキーマは、診断のために症状情報を抽出するために医師が作成した質問のリストで構成されています。たとえば、「患者に熱はありますか?」や「患者に咳がありますか?」といった質問があります。答えにはキーの位置と数値機能が含まれます。前者は、肺や胃腸管などの解剖学的な位置をエンコードします。したがって、値は、特徴タイプに応じて、カテゴリ変数またはバイナリ数値のいずれかになります。 次に、病歴や現在の病気の患者の訴え、身体検査、臨床検査などで構成されるケース データの種類ごとにスキーマを構築しました。このアーキテクチャは、新しい形式のテキストをモデル化するために使用されます。アーキテクチャ設計の根拠は、将来のさらなる研究のために、異なる病院間のデータの相互運用性を高めることです。さらに、新しい形式で記録を提供すると、特定される可能性のある元の記録を使用する場合に比べて、患者のプライバシーを保護するのに役立ちます。 トークン化と単語埋め込み 公開されているラベル付き臨床中国語データリソースが不足しているため、単語分割用の標準データセットを確立しました。 Python Tensorflow パッケージの word2vec を使用して、100 個の機能を持つ 4,363 個のトークンを埋め込み、高次元空間における単語の意味と類似性を表します。 LSTMモデルのトレーニングセットとテストセットの構築 質問と回答の抽出モデルをトレーニングするための小さなデータセットを作成し、トレーニング コホートと検証コホートの両方で質問と回答の情報に手動で注釈を付けました。はい/いいえの質問の場合は、0 または 1 を使用して表します。 フリーテキスト調整プロセスは、前述の注意ベースの LSTM を使用してモデル化されます。モデルの実装とトレーニングには Tensorflow を使用します。当社はすべての電子医療記録に NLP モデルを適用します。ハイパーパラメータを調整せず、LSTM モデルのデフォルトまたは一般的に使用されるハイパーパラメータ設定を使用しました。 階層的マルチラベル診断 診断の階層は、解剖学に基づいた分類システムを使用した専門の医師の研究によって決定されました。これは、人間の医師が患者を評価する際に鑑別診断を作成するための一般的な方法だからです。まず、診断は一般的な臓器系(呼吸器系、神経精神系、胃腸系など)に分類されました。各臓器系はさらにサブシステム(上気道、下気道など)に分かれており、「全身」は特に全身性多臓器疾患の状況におけるシステムとして分類されます。 モデルのトレーニングと検証 質問応答モデルのデータは、カテゴリ変数と「はい/いいえ」の回答の混合で構成されます。したがって、まずマトリックスにアクセスして、分類と回答を統一されたバイナリ特徴に変換します。次に、データはトレーニング セット (アクセス データ レコード全体の 70% を含む) とテスト セット (残りの 30%) にランダムに分割されます。次に、質問と回答のマトリックスを構築することにより、トレーニング コホートとテスト コホートの両方で各アクセス レコードに注釈が付けられます。各中間ノードについて、その直下の子に基づいて多クラス線形ロジスティック回帰分類器をトレーニングしました。子のすべてのサブクラスは、子のレベルに折りたたまれます。 Sklearn クラス ロジスティック回帰を使用して、デフォルトの l1 正則化ペナルティ (Lasso) を持つマルチクラス分類器をトレーニングし、限られた数の症状に基づいて医師の診断をシミュレートします。 疾患の階層的クラスタリング クラスタリング結果の堅牢性を評価するために、まずデータをランダムに 2 つに分割し、半分をトレーニング用、もう半分をテスト用にして、トレーニング データとテスト データの 2 つのクラスタリング グラフを個別に再生成します。関連する樹形図を対応する高さで個別に切断することにより、トレーニングおよびテストのクラスタリング グラフの葉を 10 個のカテゴリに割り当てました。調整済みランド指数 (ARI)24 を使用して、トレーニング データとテスト データ間のクラス割り当ての一貫性を評価しました。結果は、クラスタリング グラフが堅牢であることを示しています。 小児疾患からテキスト特徴を抽出するための教師なしクラスタリング NLP (灰色のボックスはクラスタリング ブロックです) いくつかのケースでは、システムは関連する ICD-10 コードを使用して診断をクラスター化し、人間が定義した分類システムと一致する臨床的特徴を検出する傾向があることを示唆しました。ただし、場合によっては、システムは関連する種類の診断を 1 つのカテゴリにグループ化しますが、そのカテゴリ内の他の非常に類似した診断を除外します。たとえば、「喘息」と「咳喘息」は一緒にグループ化されていますが、このカテゴリには「急性副鼻腔炎」と一緒にグループ化されている「急性喘息増悪」は含まれません。多くの場合、システムは、指示されたラベル付けや分類システムがなくても、関連する診断の広範なグループ分けに成功しました。これは、私たちが開発した臨床シグネチャが、モデル化して診断した状態間の重要な類似点と相違点をうまく学習したことを示しています。 AIシステムと人間の医師のパフォーマンスの比較 私たちは、臨床実務経験年数に基づいて 11,926 件の医療記録に手動でラベルを付けるために 20 人の小児科医を選択しました。これら 5 つのグループの医師は研修医から主治医まで多岐にわたり、臨床経験は 3 年から 25 年にわたります。各グループの医師は、独立した検証データセットから 2981 件の臨床記録のランダムなサブセットを読み取り、診断を割り当てました。各患者の記録はランダムに割り当てられ、4 人の医師 (各グループに 1 人) によって採点されました。 F1 スコアを使用して、上位 15 の診断カテゴリーにおける各医師グループの診断パフォーマンスを評価しました。 参考リンク: https://www.nature.com/articles/s41591-018-0335-9#Sec17 |
<<: 2019年の機械学習と人工知能産業の発展動向のレビュー
>>: 医学と人工知能が出会うとき、将来の医学の5つの主要なトレンドを知っておく必要があります
ICML 2023 Test of Time Awards が発表されました!今年も、昨年同様、受賞...
侵入テスト サービスの必要性は、システムへの攻撃が頻繁に行われるようになった 1 世紀以上にわたって...
会議で苦しめられてきた労働者はついに解放される!先日終了した Google Cloud Next...
業界最先端の大型モデルが一斉に「脱獄」! GPT-4 だけでなく、通常はそれほど間違いを起こさない ...
[[432777]]中国新聞社、北京、11月1日(記者:孫子発)中国国家知識産権局の沈長宇局長は1...
より持続可能な環境を目指して、私たちは革新的な技術を活用して自然災害による損失を最小限に抑える努力を...
AR/VR は双子の兄弟として語られることが多く、一般的にはアプリケーション層の新しいテクノロジー、...
ディープラーニング プロジェクトを開始する前に、適切なフレームワークを選択することが非常に重要です。...
厳選記事 | 呉嘉楽翻訳 | 黄年校正 | フェン・チェン、ヤオ・ジアリンマイク・ボストック出典 |...
[PConline News] ジャカルタアジア競技大会が閉幕し、アジア競技大会は正式に杭州タイムに...