インペリアル・カレッジ:専門医の80%が懸念する心臓リズムデバイスインプラント手術問題をAIで解決する方法

インペリアル・カレッジ:専門医の80%が懸念する心臓リズムデバイスインプラント手術問題をAIで解決する方法

インペリアル・カレッジ・ロンドンの研究者らは、ペースメーカーや除細動器のメーカーとモデルを識別するために、現在PPMnn(ペースメーカー・ニューラル・ネットワーク)と呼ばれるAIベースのソフトウェアを開発した。この研究結果は、米国心臓病学会誌(JACC):臨床電気生理学に掲載されました。この論文では、ニューラル ネットワーク ベースのシステムの開発、検証、および有効性について説明します。

[[264072]]

背景

毎年、世界中で 100 万人を超える人々が心臓リズム装置の移植を受けています。移植プロセス中、医療スタッフは通常、アルゴリズムを使用して装置の X 線画像を識別し、ペースメーカーまたは除細動器のメーカーとモデルを特定します。しかし、最も効果的なアルゴリズムであっても識別に欠陥が生じる可能性はあり、エラーによって治療が遅れる可能性もあります。

実際、心臓専門医の80%が、デバイスの識別に「しばしば」困難を感じたと報告しています。

研究者らは、5つのメーカーの45モデル、1,676台のデバイスのX線画像を抽出した。 1451 枚の画像をトレーニング セットとして使用し、画像を分類するための畳み込みニューラル ネットワークが構築されました。テスト セットには、各モデルの 5 つのサンプルを含む残りの 225 枚の画像も含まれており、デバイスを識別するニューラル ネットワークの能力と心臓専門医の能力を比較しました。

結果は、ニューラル ネットワークがデバイスの製造元を 99.6% の精度 (95% 信頼区間: 97.5 ~ 100) で正確に識別でき、モデルが 96.4% の精度 (95% 信頼区間: 93.1 ~ 98.5) で正確に識別できることを示しました。 5人の心臓専門医によるメーカー識別の平均精度は72.0%(範囲62.2%~88.9%)であり、モデルの識別は不可能でした。ニューラルネットワークに基づく認識能力は、すべての心臓専門医の認識能力よりも大幅に優れていることがわかります。

方法

データ抽出

この研究では、1998 年 2 月から 2018 年 5 月の間にインペリアル カレッジ ヘルスケア NHS トラストに埋め込まれた心拍数モニターの画像からデータセットが選択されました。

ニューラル ネットワークをトレーニングするには、十分な数のクラス例 (側面胸部レントゲン写真は除く、ポータブルおよび部門別 AP/PA 胸部レントゲン写真を含む、クラスあたり少なくとも 25 枚の画像) が必要です。画像は連続した症例患者から抽出され、クラスの不均衡を最小限に抑えるためにモデルごとに最大 40 枚の画像が抽出されました。各 X 線画像から、デバイスよりもわずかに大きい正方形の領域がセグメント化され、ネットワークの信号対雑音比が向上します。切り取られた画像は 224 × 224 ピクセルにサイズ変更され、ピクセル値が 0 から 1 の間になるように正規化されます。抽出プロセス中に、メーカーが新しいモデルを導入した場合、X 線画像で変更が検出されない場合があります。これは、単にデバイス ソフトウェアが更新されただけの場合もあれば、部品が実質的に同一で区別がつかない場合もあります。

45 のカテゴリから 5 つの画像が「テスト セット」としてランダムに割り当てられます。この画像はネットワークのトレーニング段階では使用されず、精度の最終検証でのみ使用されます。

残りの「トレーニング セット」はネットワークのトレーニングに使用され、2 つの異なる段階に分かれています。1つは、使用する基礎ネットワーク (レイヤーの数やサイズなどの構造特性を含む) と、それをトレーニングする速度 (「学習率」と呼ばれる) を決定する段階です。これらの畳み込みニューラル ネットワークは、人間の脳に似た階層構造で構成されており、画像分類の問題を解決します。第 2 段階は、ペースメーカーを分類するために重みを調整する詳細なプロセスです。どちらのステージでもトレーニング セットを使用しますが、方法は異なります。

ネットワーク トレーニング フェーズ (図 1 を参照) では、各ニューラル ネットワーク候補モデルはトレーニング セットの 75% を学習し、トレーニング セットの残りの 25% を正しく予測します。これを 4 回繰り返して、すべてのトレーニング セットが交互に両方の役割を担うようにしました。このプロセスは「4 段階交差検証」と呼ばれます。

図1 ネットワーク設計フローチャート

2 番目のステージは、前のステージで選択されたニューラル ネットワーク モデルから開始されますが、トレーニング セット全体を使用してネットワークをトレーニングし、最終的なニューラル ネットワーク モデルを取得します。

このトレーニングされたネットワーク モデルは、常に別々に保持される「テスト セット」に公開され、メーカーとモデルを正しく分類する能力が評価されます。

この研究は、保健研究局(統合研究申請システム識別子 249461)から規制承認を受けました。

畳み込みニューラルネットワークのアーキテクチャとトレーニング

モデル全体を再トレーニングする際に、ImageNet でトレーニングされた重みを使用してすべてのネットワークを初期化し、5 つの異なる畳み込みニューラル ネットワーク アーキテクチャ (DenseNet、Inception V3、VGGNet、ResNet、Xception) を評価しました。

各ネットワークの出力層は、密に接続されたニューロン 45 個 (デバイス モデルごとに 1 つに相当) に設定されました。クロスエントロピー損失関数を使用して 16 枚の画像の損失を計算し、ADADELTA オプティマイザーを使用して重みを更新します。損失は​​、ネットワーク パフォーマンスを評価し、ネットワーク パフォーマンスを改善するために使用される技術的な指標です。損失は​​単純なエラー率 (精度の逆数) よりも敏感です。これは、完全なスコア (損失ゼロ) を達成するには、ネットワークがすべてのペースメーカー画像を 100% 正しく予測する必要があるためです。

ニューラル ネットワークのトレーニングは、損失関数が安定状態に達するまで、損失を最小限に抑えるために重みを自動的に調整するプロセスです。 Tensorflow および Keras 機械学習フレームワークを使用した Python プログラミング言語でのプログラミング。

視覚化

各例は処理されて、より高い勾配を持つピクセルが正しいクラスに対応する特徴マップが提供されます (ネットワークの決定に大きく貢献したピクセルが強調表示されます)。これは、Keras-vis ソフトウェアを使用して実行できます。

アルゴリズムの助けを借りた専門家によるテスト

225枚の画像のテストセットが、リズム認識アルゴリズムCaRDIA-X(3)とともに5人の心臓専門医(うち2人は電気生理学者)に提供されました。このアルゴリズムはメーカーを区別するだけで、特定のモデルを識別することはできません。各画像から、それがペースメーカー、除細動器、ループレコーダーのいずれであるかがわかります。

評価者には、各デバイスを Biotronik、Boston Scientific、Medtronic、Sorin、または St. Jude Medical に分類するよう依頼しました。

統計分析

ニューラル ネットワークと CaRDIA-X アルゴリズムを使用した専門家によるメーカー分類の結果の比較。評価にはマクネマー検定が使用され、統計的特徴閾値として p 値 0.05 が使用されました。各専門家の評価結果に基づいて平均精度を算出します。

精度は、テスト セット内の正しく分類された画像の数をテスト セット内の画像の総数で割ったものとして定義されます。精度の信頼区間は二項法を使用して計算されました。製造元カテゴリのサイズが異なる場合は、精度と再現率の平均の 2 倍として定義される F1 スコアも計算され、範囲は 0 ~ 1 になります。

ネットワークの精度は、フィッシャーの正確検定を使用してさまざまなサブグループごとに評価されました。ウェルチの不等分散t検定を使用して、各画像のラプラス分散を計算することにより、部門別レントゲン写真とポータブルレントゲン写真の画像鮮明度の差を評価し、Rソフトウェアを使用して統計分析を実行しました。

結果

データセット

合計で、データセットにはさまざまなデバイスにわたる 1,575 人の患者の 1,676 枚の画像が含まれています。 66 種類の異なるデバイス モデルがあるにもかかわらず、その一部は見た目では区別がつかず、単にデバイスのソフトウェアの違いである可能性があります。モデルグループは 45 あり、そのうち 278 枚の X 線画像はポータブル デバイスからのものであり、残りの 1,398 枚は部門 AP でした。

テスト セット内の 45 個のモデルはそれぞれ 5 個のサンプルで構成され、合計 225 個のサンプルになります。

(左) ニューラル ネットワークで 5 人の人間の記者とデバイス メーカーを識別する際の比較精度を示す棒グラフ。 p 値は、中央値および人間の評価に対するニューラル ネットワークの優位性を示します。 (右) 混同行列は、ネットワークが正しいデバイス製造元を予測する精度を示しています。 BIO = Biotronik、BOS = Boston Scientific、MDT = Medtronic、SOR = Sorin、STJ = St. Jude。

ステージ1: さまざまなニューラルネットワークアーキテクチャのパフォーマンス比較

すべてのネットワーク モデルにおいて、ステージ 1 でのトレーニング後、ネットワーク パフォーマンスは安定した状態に達し、損失関数は安定したレベルまで低下しました。 VGGNet の精度は 4.4%、Xception の精度は 91.1% です。

ステージ 1 の終了により、ステージ 2 で Xception アーキテクチャを選択するための基礎が築かれ、トレーニング エポックが 15 に事前指定されます。次に、1,451 枚の画像の完全なトレーニング セットを使用してトレーニングされた、まったく新しい Xception ニューラル ネットワークを使用して第 2 段階が開始されます。第 2 段階で生成された最終的なニューラル ネットワークは、「テスト セット」データのテストと検証に使用されます。

フェーズ2:「テストセット」でニューラルネットワークのパフォーマンスを検証する

最終的なニューラル ネットワークは、デバイスの製造元を 99.6% の精度で識別し、F1 スコアは 0.996 になりました。パフォーマンスは図 1 に示されています。誤分類された画像は、Medtronic Adapta デバイスを Sorin Reply デバイスと間違えたものです。

必然的に、モデル グループ (メーカーだけではなく) を識別するパフォーマンスは低下し、精度は 96.4% (95% CI: 93.1 ~ 98.5)、F1 スコアは 0.964 でした。注目すべきは、8 つの予測のうち、正しいモデルが上位 3 つの予測のうちの 1 つであったことです。したがって、一般的に説明される「トップ 3」の精度は 99.6% (95% CI: 97.5 ~ 100.0) です。

モデル識別マトリックス

モデル認識精度は、ポータブルX線画像では89.5%(95% CI: 75.2 - 97.1)、部門X線画像では97.9%(95% CI: 94.6 - 99.4)でした(2つのグループ間の差はp = 0.029)。しかし、メーカーは部門別X線画像を誤って分類しています。ペースメーカー群の精度率は95.0%(95% CI: 90.4 - 97.8)、ICD群では96.4%(95% CI: 87.5 - 99.6%)であった(2群間の差はp = 1.00)。メーカー間で精度に有意差はなかった(p = 0.954)。

医療専門家のパフォーマンスとの比較

5 人の心臓専門医が CaRDIA-X アルゴリズムを使用して、5 つのメーカーの 225 枚の画像のテスト セットを分類しました。精度は 62.3% から 88.9% の範囲で、平均精度は 72.0% となり、ニューラル ネットワークのパフォーマンスは専門家よりもはるかに優れていました。

ビジュアル分析

別の探索的分析では、テスト セット内の各画像の特徴マップを生成し、臨床医学における病気の症状に類似した、画像が表す心拍数モニターの特性を示しました。

図 3 は 2 つの異なるモデルの 4 つの画像を示しており、図 4 は AT500 デバイスの機能マップを示しており、デバイスを囲む特徴的なリング状の回路基板アセンブリを示しています。

図3

図4

話し合う

これは、人工知能を使用してX線画像から心臓のリズムデバイスを識別する研究です。ニューラル ネットワークは、デバイスの製造元を識別する際の精度が高まりました。これまでに見たことのない画像に対して、ネットワークは99.6パーセントの精度でデバイスの製造元を特定することができたが、専門家の精度は62.3パーセントから88.9パーセントだった。

臨床応用

臨床応用においては、少なくとも心臓専門医と同程度の信頼性を持つ、より高速なツールがあれば非常に役立ちます。医師はこれを使用して、簡単な胸部X線写真から心臓装置の特性を迅速に評価します。患者のデバイスと通信できるのは特定のメーカーのみであるため、どのプログラマーを持参すればよいかを知っておくと、貴重な臨床時間を節約でき、緊急時にデバイスに迅速にアクセスして緊急治療を提供できるようになります。

機械学習: 特徴マップ

図 3 では、心臓専門医を含むほとんどの人にとって、ペースメーカーの 2 つのモデルを区別することは困難です。ただし、ニューラル ネットワークはそれらを正確に区別できるだけでなく、特徴マップはそれらを区別する最も明白な特徴も強調表示します。さらに、この顕著な特徴が指摘されると (図 4)、区別するのは簡単になります。

ネットワークアーキテクチャはパフォーマンスに大きく影響する

表 2 は、さまざまなニューラル ネットワーク アーキテクチャのパフォーマンス レベルを示しています。VGGNet はこのタスクでのパフォーマンスが低いことがわかります。 ResNet は、元の画像をネットワークの後続のすべてのレイヤーで使用できるようにする「残差接続」を設計します。 GoogLeNet Inception は「1×1 畳み込み」を使用してレイヤー間の情報を圧縮し、ネットワークの複雑さを大幅に軽減します。より優れたパフォーマンスを実現する設計は Xception であり、この 2 つのイノベーション「残差接続」と「1×1 畳み込み」を広範に活用しています。

制限

ニューラル ネットワークは英国で一般的に使用されているデバイスを認識できますが、すべてのデバイスに適応できるわけではありません。もちろん、ネットワークは継続的に拡張でき、ニューラル ネットワークのトレーニングには新しいデバイスからの 25 個のサンプルのみが必要です。

ニューラル ネットワークは誤った結論を導き出すことがあります。これは、ネットワークが 96.4% を正しく選択したにもかかわらずです。しかし、(偶然にも)99.6% の確率で、正しいモデルは上位 3 つの予測のうちの 1 つになります。

すべてのニューラル ネットワークには「過剰適合」のリスクがあります。私たちは 2 つの方法で過剰適合のリスクを最小限に抑えるよう努めています。まず、ネットワークのパフォーマンスは、トレーニングに使用されていない「テスト セット」での精度として定義されます。第二に、ドロップアウトや重み減衰などのさまざまな「正規化」手法がネットワークに組み込まれています。

ニューラル ネットワークを研究室からベッドサイドへ移行することは、ケアの現場で必ずしも大量の処理能力が必要になるわけではないため、困難な場合があります。誰でも利用できるオンライン Web ポータルを提供することで、この問題を軽減できます。

結論は

この研究は、畳み込みニューラル ネットワークが X 線から心臓リズム装置のメーカーとモデルを正確に識別できることを実証しています。さらに、そのパフォーマンスは、フローチャートを使用した心臓専門医のパフォーマンスを大幅に上回りました。

医療能力: 機械学習と人工知能は医療分野、特に医療画像分析の分野で急速に発展しています。私たちのアプローチにより、患者の診断と治療が加速されます。この論文では、ニューラル ネットワークが医療システム全体で大量の医療データを処理するためにますます使用されていること、そして将来の患者ケアがコンピューター支援による意思決定にますます依存するようになる可能性があることも示しています。

コンピューターラボでの機械学習の結果を実際のアプリケーションに変換するのは、多くの場合困難です。私たちは研究を通じて、医師がオンラインでネットワークとやりとりできるオンライン教育ポータルを提供しています。いつものように、ニューラル ネットワークを効果的なツールとして導入する前に、その精度を評価するためのさらなる臨床研究が重要になります。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

<<:  AIは水産養殖業界に浸透しつつある。品質と効率性の向上に加え、人員の削減にもつながる。

>>:  驚きですか、それともショックですか?機械学習アルゴリズムの「高エネルギー」な瞬間を評価する

ブログ    
ブログ    

推薦する

...

ディープラーニングと機械学習の違いを理解する

機械学習とディープラーニングの違いは何だろうとよく疑問に思う方は、この記事を読んで、その違いを一般の...

機械学習の経験を人生の指針に活用する: 学習効率を最大化する方法

[[185313]]原作者 | ライムンド・マンテローラ編集チーム | Aileen、Huang W...

AIを使って内部脅威を特定することの倫理

マイノリティ・リポートのトム・クルーズを覚えていますか? AI は将来のリスクを示唆する従業員の行動...

オンラインショッピングに革命が起こりました! Googleの最新AIモデルでは、姿勢を変えずにワンクリックで服を試着できる

ワンクリック着せ替えがGoogleで実現しました!このAIフィッティングモデルTryOnDiffus...

...

非常に厳しい CPU 制約下でも正常に動作しますか? Java におけるさまざまな圧縮アルゴリズムのパフォーマンス比較

この記事では、一般的に使用されているいくつかの圧縮アルゴリズムのパフォーマンスを比較します。結果は、...

人工知能は人間の文化を継承するが、人間の偏見も受け継いでいる

テクノロジーは既存の人間文化の延長です。テクノロジーは人類の知恵を広げた一方で、人々の偏見や差別も受...

...

アヴネットの鍾喬海氏:人工知能はモノのインターネットの実装を加速させる

【51CTO.comオリジナル記事】 今日では、AI や IoT テクノロジーに投資する企業がますま...

人工知能は世界を支配するのでしょうか?

技術が急速に進歩する時代において、人工知能 (AI) が最終的に世界を支配するかどうかという差し迫っ...

DeepSpeechを使用してアプリ内で音声をテキストに変換する

アプリでの音声認識は単なる楽しい機能ではなく、重要なアクセシビリティ機能です。コンピュータの主な機能...

ドイツのハッカーはレンタルしたコンピュータリソースを使ってハッシュアルゴリズムを攻撃する

ドイツのセキュリティ愛好家が、レンタルしたコンピュータ リソースを使用して、SHA1 ハッシュ アル...

メタバース内の物に触れるために、ザッカーバーグは6ドルの電子スキンを新たに作った。

[[433039]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

トランスフォーマーベースの効率的で低遅延のストリーミング音声認識モデル

シナリオの観点から、音声認識はストリーミング音声認識と非ストリーミング音声認識に分けられます。非スト...