放射線科医は再び危機に陥っている！海外の主要5機関が共同で最新の「胸部X線」ベンチマークを発表

胸部X線（CXR）検査は、さまざまな病気のスクリーニングや診断に広く使用されている臨床画像診断法です。

臨床診断には一般的な病気の種類だけでなく、対応する重症度や不確実性も含まれることがよくあります。現在の医療画像データベースは、病気の種類を予測することに満足することが多く、臨床的に重要な後者を無視しています。

最近、テキサス大学アーリントン校、NIH、理化学研究所、東京大学、国立がん研究センターの研究者らは、臨床的観点からの疾患の重症度と不確実性を含む新しいデータセットを提案し、CXR疾患分類のための解剖学的に考慮した多関係グラフ学習法を提案しました。

論文アドレス: https://arxiv.org/abs/2309.03331

プロジェクトのホームページ: https://github.com/MengRes/Uncertain-Label.git

データセット: https://physionet.org/content/cad-chest/1.0/

この論文の主な貢献は次の 2 つです。

1. 病気の重症度と不確実性を含むデータセットを作成します。

2. CXR疾患分類のために、医学的知識を用いた多関係グラフ学習法を提案する。

新しいデータセット

病気の重症度を診断することは、臨床診断において重要であり、病気のクラスの有無という二元的な分類を超えています。MIMIC-CXR データセット (最大の胸部放射線データセットの 1 つ) と付随する放射線レポートでは、病気の重症度の説明 (図 1 の「少量の胸水」や「軽度の心肥大」など) が一般的です。

図 1: 放射線レポートにおける疾患の不確実性と重症度の記述 (疾患は赤で強調表示、重症度は緑で強調表示、不確実性は青で強調表示)

私たちの知る限り、報告された疾患の重症度の問題を扱った研究はこれまでありません。

第二に、胸部X線写真の根本的な複雑さと難しさのため、医師の病気の不確実性をモデル化することが重要です。放射線科医は、臨床記録の中で不確実性の程度を示すために、「可能性がある」「除外されない」「おそらく」などの用語を頻繁に使用します。

これまでの研究の大半では、この不確実性は臨床上の意思決定を誤らせる可能性がある否定的なカテゴリーであるとみなされていました。

研究者らはルールベースの抽出アプローチを使用して、放射線レポートから病気の名前、重症度、不確実性に関する情報を抽出しました。

研究者らは、病名については各疾患の可能な表現をリスト化し、疾患の重症度については重症度を示す単語をリスト化し、表1に示すように軽症、中等症、重症の3段階に定量化した。

病気の不確実性に関しては、研究者は医師と協力して、さまざまな不確実性を表す単語とラベル値のマッピングを作成し、さまざまな重症度をさまざまなラベル値に対応させました。表 2 に示すように、病気の説明が確実であるほど、ラベル値は高くなります。

表1: 病気の重症度を表す言葉

表2: 病気の不確実性を示す言葉

研究者らは、抽出されたラベルの正確性を評価するために、経験豊富な医師を招きました。医師には、ランダムに選択された 500 件の放射線レポートと、それに対応する抽出された疾患、重症度、および不確実性のラベルが提供されました。

ラベルの精度は、表 3 に示すように、医師のフィードバックに基づいて統計的に分析されました。

表3: 抽出されたラベルの精度評価

方法

抽出されたラベルに基づいて、グラフネットワークを使用して病気を分類します。

医師から提供された医学的知識に基づいて、空間グラフ（解剖学的構造間の関係を表す）、意味グラフ（疾患間の関係を表す）、暗黙的グラフ（潜在的な関係を表す）の 3 種類のグラフネットワーク関係が構築されました。

モデル構造を図2に示します。詳細については論文を参照してください。

図2: 方法のネットワーク構造

実験

研究者らは抽出したラベルについて実験を行い、他の方法と比較しました。結果は表 4 に示されています。

表4: 他の方法との比較結果

研究者らは、モデルをトレーニングするために、Ours (0-1) と Ours (Uncertain) と表記されるバイナリラベルと不確実なラベルを使用しました。

この方法の性能をさらに研究するために、本論文ではアブレーション研究も実施しています。各実験は、空間グラフ、セマンティックグラフ、バイナリラベルと不確実なラベルを含む暗黙的グラフで個別にトレーニングされます。

著者らは、関心のある疾患領域を、ResNet-50 モデルで Grad-CAM を使用して生成された領域と比較しました。下図のようにレポートから異常領域を抽出します。放射線学的検査の結果、両側の下肺（左下肺と右下肺）に陰影が認められることが判明しました。

さらに、右肺の陰影は肺炎を示している可能性があります。 ResNet-50 モデルは、不透明度と肺炎の症例における右下肺、右中肺、および心臓領域に焦点を当てています。

報告書から、心臓領域には異常がないことがわかりますが、左下肺の病気が見逃されており、Grad-CAMの結果の精度が低くなっています。研究者らが提案したモデルは、左下肺と右下肺の両方に焦点を当てており、ResNet-50 法よりも優れたパフォーマンスを発揮します。

図 4: レポート内の異常の説明は赤で強調表示され、テキストから抽出された異常と場所がレポートの下に表示されます。比較のために、各異常ごとに 2 つの画像が提供されます。 (a) と (c) は、ResNet-50 モデルで Grad-CAM によって取得された異常な関心領域です。 (b) と (d) は研究者の方法で得られた関心ノードです。結果では、各境界ボックスは解剖学的領域内のノードに対応しており、赤い境界ボックスは最も注目度の高いノードであり、黄色の境界ボックスは赤い境界ボックスに密接に関連するノードに対応しています。緑色の矢印はノード間の接続を示します。

結論は

本研究では、著者らは臨床診療における CXR 疾患診断の記述における疾患の重症度と不確実性の問題について検討した。

この問題に対処するために、著者らはルールベースのアプローチを使用して、放射線レポートから疾患の重症度と不確実性を含むラベルを抽出しました。

このデータセットでは、著者らは医学的知識に基づいたグラフニューラルネットワークを使用して、病気の重症度と不確実性を予測しました。

<<: 情報格差を打破せよ！大規模モデル向けの驚異的な 3D 視覚化ツールです。

>>:

ブログ

放射線科医は再び危機に陥っている！海外の主要5機関が共同で最新の「胸部X線」ベンチマークを発表

新しいデータセット

方法

実験

結論は

75歳のヒントン氏が再び警告：AIが人間を支配するかもしれない！

AIが教育技術分野にもたらす変化パーソナライズされた学習が従来の教育方法を超える

人工知能はあなたよりも多くの XXX スターを知っている

データセットに適したクラスタリングアルゴリズムを選択する方法

AIとIoTが建設業界に価値をもたらす方法

英国を拠点とするサマドは、eVTOL飛行試験と新型貨物ドローンの開発を進めている。

完璧な最適化目標、AIの盲点

推薦する

ディープフェイクは今回、顔を変えるだけでなく、街そのものを変えてしまった。

ChatGPT の大きなアップデート！ OpenAI はプログラマー向けの素晴らしいギフトパッケージを提供しています。API にキラー機能が追加され、値下げ、新しいモデル、4 つのコンテキストがすべて揃っています。

自然言語処理におけるAIの未来を探る

切り抜きや着色を超えて、人工知能がデザインに及ぼす影響をご覧ください

ガートナー：2025年にはベンチャーキャピタル投資の75%がAIを活用する

インテリジェント運転の「人材不足」は大学の科目ゲームに閉じ込められている

将来に影響を与える戦略的テクノロジートレンドトップ10

文字の組み合わせをソートするJavaアルゴリズム