放射線科医は再び危機に陥っている!海外の主要5機関が共同で最新の「胸部X線」ベンチマークを発表

放射線科医は再び危機に陥っている!海外の主要5機関が共同で最新の「胸部X線」ベンチマークを発表

胸部X線(CXR)検査は、さまざまな病気のスクリーニングや診断に広く使用されている臨床画像診断法です。

臨床診断には一般的な病気の種類だけでなく、対応する重症度や不確実性も含まれることがよくあります。現在の医療画像データベースは、病気の種類を予測することに満足することが多く、臨床的に重要な後者を無視しています。

最近、テキサス大学アーリントン校、NIH、理化学研究所、東京大学、国立がん研究センターの研究者らは、臨床的観点からの疾患の重症度と不確実性を含む新しいデータセットを提案し、CXR疾患分類のための解剖学的に考慮した多関係グラフ学習法を提案しました。

論文アドレス: https://arxiv.org/abs/2309.03331

プロジェクトのホームページ: https://github.com/MengRes/Uncertain-Label.git

データセット: https://physionet.org/content/cad-chest/1.0/

この論文の主な貢献は次の 2 つです。

1. 病気の重症度と不確実性を含むデータセットを作成します。

2. CXR疾患分類のために、医学的知識を用いた多関係グラフ学習法を提案する。

新しいデータセット

病気の重症度を診断することは、臨床診断において重要であり、病気のクラスの有無という二元的な分類を超えています。MIMIC-CXR データセット (最大の胸部放射線データセットの 1 つ) と付随する放射線レポートでは、病気の重症度の説明 (図 1 の「少量の胸水」や「軽度の心肥大」など) が一般的です。

図 1: 放射線レポートにおける疾患の不確実性と重症度の記述 (疾患は赤で強調表示、重症度は緑で強調表示、不確実性は青で強調表示)

私たちの知る限り、報告された疾患の重症度の問題を扱った研究はこれまでありません。

第二に、胸部X線写真の根本的な複雑さと難しさのため、医師の病気の不確実性をモデル化することが重要です。放射線科医は、臨床記録の中で不確実性の程度を示すために、「可能性がある」「除外されない」「おそらく」などの用語を頻繁に使用します。

これまでの研究の大半では、この不確実性は臨床上の意思決定を誤らせる可能性がある否定的なカテゴリーであるとみなされていました。

研究者らはルールベースの抽出アプローチを使用して、放射線レポートから病気の名前、重症度、不確実性に関する情報を抽出しました。

研究者らは、病名については各疾患の可能な表現をリスト化し、疾患の重症度については重症度を示す単語をリスト化し、表1に示すように軽症、中等症、重症の3段階に定量化した。

病気の不確実性に関しては、研究者は医師と協力して、さまざまな不確実性を表す単語とラベル値のマッピングを作成し、さまざまな重症度をさまざまなラベル値に対応させました。表 2 に示すように、病気の説明が確実であるほど、ラベル値は高くなります。

表1: 病気の重症度を表す言葉

表2: 病気の不確実性を示す言葉

研究者らは、抽出されたラベルの正確性を評価するために、経験豊富な医師を招きました。医師には、ランダムに選択された 500 件の放射線レポートと、それに対応する抽出された疾患、重症度、および不確実性のラベルが提供されました。

ラベルの精度は、表 3 に示すように、医師のフィードバックに基づいて統計的に分析されました。

表3: 抽出されたラベルの精度評価

方法

抽出されたラベルに基づいて、グラフネットワークを使用して病気を分類します。

医師から提供された医学的知識に基づいて、空間グラフ(解剖学的構造間の関係を表す)、意味グラフ(疾患間の関係を表す)、暗黙的グラフ(潜在的な関係を表す)の 3 種類のグラフ ネットワーク関係が構築されました。

モデル構造を図2に示します。詳細については論文を参照してください。

図2: 方法のネットワーク構造

実験

研究者らは抽出したラベルについて実験を行い、他の方法と比較しました。結果は表 4 に示されています。

表4: 他の方法との比較結果

研究者らは、モデルをトレーニングするために、Ours (0-1) と Ours (Uncertain) と表記されるバイナリ ラベルと不確実なラベルを使用しました。

この方法の性能をさらに研究するために、本論文ではアブレーション研究も実施しています。各実験は、空間グラフ、セマンティック グラフ、バイナリ ラベルと不確実なラベルを含む暗黙的グラフで個別にトレーニングされます。

著者らは、関心のある疾患領域を、ResNet-50 モデルで Grad-CAM を使用して生成された領域と比較しました。下図のようにレポートから異常領域を抽出します。放射線学的検査の結果、両側の下肺(左下肺と右下肺)に陰影が認められることが判明しました。

さらに、右肺の陰影は肺炎を示している可能性があります。 ResNet-50 モデルは、不透明度と肺炎の症例における右下肺、右中肺、および心臓領域に焦点を当てています。

報告書から、心臓領域には異常がないことがわかりますが、左下肺の病気が見逃されており、Grad-CAMの結果の精度が低くなっています。研究者らが提案したモデルは、左下肺と右下肺の両方に焦点を当てており、ResNet-50 法よりも優れたパフォーマンスを発揮します。

図 4: レポート内の異常の説明は赤で強調表示され、テキストから抽出された異常と場所がレポートの下に表示されます。比較のために、各異常ごとに 2 つの画像が提供されます。 (a) と (c) は、ResNet-50 モデルで Grad-CAM によって取得された異常な関心領域です。 (b) と (d) は研究者の方法で得られた関心ノードです。結果では、各境界ボックスは解剖学的領域内のノードに対応しており、赤い境界ボックスは最も注目度の高いノードであり、黄色の境界ボックスは赤い境界ボックスに密接に関連するノードに対応しています。緑色の矢印はノード間の接続を示します。

結論は

本研究では、著者らは臨床診療における CXR 疾患診断の記述における疾患の重症度と不確実性の問題について検討した。

この問題に対処するために、著者らはルールベースのアプローチを使用して、放射線レポートから疾患の重症度と不確実性を含むラベルを抽出しました。

このデータセットでは、著者らは医学的知識に基づいたグラフニューラルネットワークを使用して、病気の重症度と不確実性を予測しました。

<<:  情報格差を打破せよ!大規模モデル向けの驚異的な 3D 視覚化ツールです。

>>: 

ブログ    
ブログ    

推薦する

...

...

ChatGPT Enterprise Edition は基本的に廃止されました。

執筆者 | Yan Zheng制作:51CTO テクノロジースタック(WeChat ID:blog)...

リチウム電池の防爆結果がネイチャー誌の表紙に登場、UCLAの中国チームが制作

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

2021年には、神経科学AIにいくつかの大きなトレンドがあります

新年が私たちに手を振っています。素晴らしい革命の伝統を引き継ぎ、最新の AI 専門家の予測レポートを...

ガウス混合モデルを用いた多峰性分布の分離

この記事では、ガウス混合モデルを使用して 1 次元の多峰性分布を複数の分布に分割する方法を説明します...

...

OpenAIがマスク氏に正面から対決!イリヤは8年間のメールの「犯罪」を暴露した後、ついに姿を現した

5日後、OpenAIはついにマスク氏の訴訟に正式に反応しました。ちょうど今、OpenAI は同社とマ...

階段を登るための最小コストを使用するデータ構造とアルゴリズム

[[443068]]最小限のコストで階段を登るLeetCode の問題へのリンク: https://...

自動化によってセキュリティアナリストがいなくなる可能性はありますか?

否定できない現実として、私たちは自動化の時代に入り、それに伴い人工知能 (AI)、機械学習 (ML)...

AIは旅行業界の困難を軽減できるか?

[[323317]]現時点では、多くの企業が、数か月前に考えていたよりも見通しが不透明であると感じ...

...

...

ZTouch、AIを活用して広告効果を高めるデジタル広告プラットフォーム「Darwin」をリリース

2021年5月20日、北京中良プロトンネットワーク情報技術有限公司傘下の企業向けデジタルサービスプラ...