MITが提案:医療モニタリングのためのベイジアンディープラーニングの導入

MITが提案:医療モニタリングのためのベイジアンディープラーニングの導入

紙:

http://wanghao.in/paper/NatureMedicine21_MSA.pdf

ベイズの定式化とアルゴリズムの詳細:

http://wanghao.in/BayesDL4MSA.html

ベイジアンディープラーニング調査:

出典:http://wanghao.in/paper/CSUR20_BDL.pdf

ベイジアンディープラーニング Github リポジトリ:

https://github.com/js05212/BayesianDeepLearning-Survey/blob/master/README.md

私たちが Nature Medicine に発表した研究についてお話ししましょう。これは私が MIT 在籍中に取り組んだ最も興味深い研究の 1 つです。この投稿が、健康モニタリングにおける機械学習(特にベイジアンディープラーニング)の応用を誰もが理解するためのデータポイントとなることを願っています。

1. 応用シナリオ

簡単に言えば(SF)、私たちが作ったシステムは、家の中のWiFi信号を感知することで、患者が医師の指示に従って、インスリンペンや定量噴霧式吸入器などの医療器具を時間通りに使用して自己治療しているかどうかを監視できます。これらの医療機器の使用は少々複雑なため(例えば、インスリンペンは 8 ステップ、定量噴霧式吸入器は 6 ステップ)、患者が使用中にミスをしてしまうことがよくあります。当社のシステムでは、患者が手順を忘れたり、正しく実行しなかったりしたかどうかを自動的に検出することもできます。私たちはこのアプリケーションを「薬剤自己投与」(または MSA)と呼んでいます。具体的な使用シナリオを下図に示します。

インスリンペンと定量噴霧式吸入器の使用手順については、下の図をご覧ください。

2.連続時間領域における確率的推論

機械学習に精通している学生なら、この問題が実際にはより複雑な確率的推論の問題であることに気付いたかもしれません。

1. ステップによって所要時間は異なります。たとえば、図 4a では、ステップ 1 の「ツールを手に取る」は通常約 4 秒しかかかりませんが、ステップ 6 の「薬を塗って保持する」は通常約 12 秒かかります。したがって、異なるステップの期間は異なる確率分布に従うと考えられます。下記の通りです。そして、私たちのモデルは、この事前の知識を統合する必要があります。

2. 異なるステップ間の空白時間は長くても短くてもかまいません (上記の緑の中央の白い領域など)。

3. 患者は重要な手順を忘れてしまうことがよくあります。たとえば、インスリンペン(上の写真参照)の場合、患者がよく忘れる手順は、ステップ 2「カートリッジの装着」とステップ 4「インスリンペンの準備」です。この時点で、インスリン ペンのプロセス全体を、以下に示すように有限状態マシンに描画できます。図のステップ 1 からの 2 つの「50%」パスは、患者がステップ 2 を忘れて直接ステップ 3 に進む確率が 50% (事前確率) あることを示しています。これは、モデルが統合する必要がある事前知識でもあります。

3.ベイジアンディープラーニング

(ディープラーニングと確率推論の組み合わせ)

技術的な観点から、この研究では、基盤となる FMCW レーダーの知覚とトップレベルの連続時間 BayesNet 推論を組み合わせて、慢性疾患患者がインスリンペンや吸入器などの医療ツールを時間どおりに使用して治療しているかどうかを 24 時間非接触で推測し、特定の使用手順で異常を自動的に検出できるベイジアン ディープラーニング モデルを作成しました。システム全体のフローチャートは以下のようになります。

これには 2 つのリンクされたモデルが含まれます。

最初のモデルは、Wi-Fi のような信号 (基礎となる FMCW レーダー信号) を処理するために使用されるディープ ニューラル ネットワークです。これは、上図のステージ 1 とステージ 2 の統合に相当します。このディープモデルの入力は、数分間続くレーダー信号の多数のフレーム (上図の最初の行を参照) であり、出力は、各フレームが異なるステップに属する確率 (上図のステージ 2 の出力を参照) です。つまり、投薬プロセスに 6 つのステップが含まれている場合、各フレームの出力は 6 次元ベクトルになり、これらの 6 次元の数値の合計は常に 1 になります。

2 番目のモデルは、上図のステージ 3 に相当します。ステージ 2 の生の確率スコアに基づいて、前述の「連続時間領域での確率推論」を組み合わせて、さらに確率推論を実行し、最終的な予測を出力します (上図の最後の行を参照)。

これら 2 つのモデルのうち 1 つは、高次元信号の処理を担当するディープ モジュール (知覚モジュールとも呼ばれる)として機能し、もう 1 つは、タスク関連の確率推論の実行を担当する確率推論モジュール (タスク モジュールとも呼ばれる)として機能します。 2 つのモジュールはエンドツーエンドで連携して動作することができ、これをベイジアン ディープラーニングと呼びます。

興味のある学生は、「ベイジアン深層学習に関する調査」をご覧ください。

出典:http://wanghao.in/paper/CSUR20_BDL.pdf

4.ディープラーニングとベイジアンディープラーニング

それで疑問なのは、なぜここで 2 番目のモデルのリンクが必要なのかということです。最初のモデルを直接使用して問題を解決できないのはなぜですか?

これは、ディープ ニューラル ネットワークとしての最初のモデルは、各フレームに対して独立した確率予測を行うことのみを担当し、推論のためにフレームの前の部分と次の部分を組み合わせることができないためです。 その結果、直接出力されるフレームごとの予測は、多くの場合、意味をなさないものになります。たとえば、次のような予測が出力されることがあります: 最初の 0.1 秒では、患者はステップ 3 でまだデバイスを使用しており、次の 0.1 秒でステップ 1 に直接戻り、次の 0.1 秒で再びステップ 4 に戻ります。普通の人間がこのような一連の動作を実行することは明らかに不可能です。したがって、2 番目のモデルの役割は、連続時間領域における事前の知識 (前のセクション「連続時間領域における確率的推論」で説明した 3 つの側面) をモデルに統合し、エンドツーエンドの推論を実行して、最終的な予測を取得することです。確率的推論とディープラーニングを組み合わせたこのフレームワーク全体をベイズディープラーニングと呼びます。

これを行うと、2 つの利点があります。最初の側面は、モデルの精度と堅牢性を大幅に向上させることです。確率的推論の存在により、モデルは数分間の行動シーケンス全体に基づいて、患者が医療用投薬ツールを使用しているかどうかを判断します。これにより、最初のモデルの誤った予測の一部が自動的に修正されるだけでなく、無関係なノイズがシステム全体に与える影響が大幅に軽減されます。 2 番目の側面は、モデルに解釈可能性を提供することです。 @kkhenry が言ったように、説明可能性は、AI システムのユーザー (医師やその他の医療従事者) がモデルの予測を信頼できるかどうかに関係するため、医療アプリケーションでは非常に重要です。確率推論部分では、各ステップの予測の確率と、モデル予測が事前知識からどの程度逸脱しているかを示し、説明を提供することができます。たとえば、モデルは「この患者は午前 9 時に医療用具を使用したが、使い方が間違っていた」と結論付け、「これは、モデルが患者がステップ 2 をスキップしたと 95% 確信しているためです」と説明できます。医師は、モデルによって提供された説明に基づいて、患者の特定のデータをさらに調べて患者に注意を促すかどうかを決定できます。下記の通りです。

5. 技術的な詳細を組み合わせる方法

2つのモデルからの予測

出力に関しては、フレームごとに 2 つの予測が行われます。最初の予測は、最初のモデル (ディープラーニング モデル) によって提供されるフレーム レベルの予測から得られます。これは非常に単純で、ニューラル ネットワークが出力に対して Softmax 演算を実行した後に取得される各カテゴリの確率として理解できます。 2 番目の予測は、2 番目のモデル (確率推論モデル) から得られます。これは事前確率としてのランダムプロセスから来ています。具体的には、連続時間領域における点過程マルコフ連鎖の組み合わせです。点過程は各ステップ (ステップ 2 など) の長さをモデル化する役割を果たし、マルコフ連鎖はステップ間の遷移をモデル化する役割を果たします (たとえば、ステップ 1 を実行した後、ステップ 2 を実行する確率は 50%、ステップ 3 を実行する確率は 50% です)。

ここで興味深いのは、ポアソン過程などの一般的な点過程のみを使用する場合、各ステップの長さを適切にモデル化する方法がないということです。これは、ポアソン過程が各ステップの長さが指数分布であると仮定し、指数分布の期待値(平均)が決定されると(たとえば、a)、その分散も決定される(a^2 に等しい)ためです。したがって、分布の期待値と分散を自由に記述できるガウス分布ほど柔軟ではありません。そこで、私たちはアイデアを思いつき、モデルの事前分布の 1 つとして、ポアソン過程の指数分布をガウス分布に置き換えました。各ステップ期間のガウス分布の期待値と分散は異なりますが、これはトレーニング データから直接推定できます。

したがって、最初のモデル(ディープラーニングモデル)の予測スコアと 2 番目のモデルによって提供される事前スコアを直接組み合わせ、近似動的プログラミングアルゴリズムを追加して、共同(またはエンドツーエンド)確率推論を実行し、最終的な予測を取得します。下の図は、モデル予測 (AI 予測) と人間による注釈 (人間による注釈) の比較を示しています。最初の 3 つの例 (a、b、c) は、インスリン ペンを使用する 3 人の異なる患者で、合計 8 つのステップがあります。次の 3 つの例は、計 6 つの手順で定量噴霧式吸入器を使用する 3 人の異なる患者の例です。私たちのモデルの最終的な予測は非常に正確であり、物理的に不可能な予測はないことがわかります。

6. 最後に

この投稿全体は、機械学習(より具体的にはベイズ深層学習)とその医療への応用について語る出発点にすぎません。

最後に、この仕事に私を招待してくれた趙社長に感謝したいと思います。 MIT に入学したばかりの頃、ベイジアン ディープラーニングを医療に応用することを考えていたことを覚えています。ワイヤレス信号をモデル化するためにディープ モジュール (つまり、知覚モジュール) を使用し、医療関連の確率推論を実行するために確率モジュール (つまり、タスク モジュール) を使用するつもりだと言いました。結局それが実現するとは思っていませんでした。考え続ければ、必ず答えが出るとも言えます:)

Icons8 のMaria Shukshina によるイラスト

<<:  AIビデオ分析が業務を強化できる4つの方法

>>:  IBM Cloud Pak for Data 4.0 で大規模なインテリジェント オートメーションを統合

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

百度、検索エンジンアルゴリズムを調整して微博コンテンツのインデックスを強化

情報筋によると、検索エンジンの百度は先週、検索アルゴリズムを調整し、微博のコンテンツのインデックスを...

正規化を放棄することで、ディープラーニングモデルの精度は前例のないレベルに到達しました

データを機械学習モデルに渡すときには、データを正規化する必要があることはわかっています。データの正規...

「認知の輪」を解読する:AIと人間の究極の戦い

今日は週末なので、深遠な話をするふりをして話をしましょう。現在、人工知能について議論する場合、ほとん...

ロボット宅配便があなたの玄関までお届けします!フォードが「無人配送」の最後のハードルを解決

Google と Amazon が競い合っている無人配達市場を覚えていますか? そこに新たなプレーヤ...

機械学習による分類とその応用を理解するための図

機械学習は主に教師あり学習、教師なし学習、強化学習に分けられます。ただし、各手法の適用分野はそれぞれ...

ジェネレーティブAIを管理する方法

ドム・クッドウェル著ノアが編集制作:51CTO テクノロジースタック(WeChat ID:blog)...

人工知能をうまく実装するにはどうすればよいでしょうか?

人工知能 (AI) と機械学習 (ML) は、ビジネスの流行語から、より広範な企業での導入へと移行し...

開発が急ピッチで進む、医療ロボットには大きな可能性がある

今日の社会では、ロボットはますます人間とつながるようになっています。産業用ロボットが組立ラインで忙し...

人工知能は患者と医療業界の両方にどのような利益をもたらすのでしょうか?

人工知能は医療業界のシステムと方法を変えています。半世紀以上にわたり、人工知能とヘルスケアは一緒に発...

...

Quora は機械学習をどのように活用していますか?

[[202181]] 2015年、同社のエンジニアリング担当副社長であるXavier Amatri...

プロセス制御に人工知能をうまく導入する方法

製造業は、生産、意思決定、運用効率などのアプリケーションに人工知能 (AI) が導入されることで、大...

2021年のAIの現状: 言語モデル、ヘルスケア

人工知能は、人間の活動と市場投資の2つの主要分野である健康と言語に拡大しています。 「State o...

ゲイツは間違っていた!これはロボットが仕事を奪うことに対処するための最善の解決策です

落ち着いてください。ロボットや人工知能 (AI) システムが人間の労働力を置き換えるにはまだ程遠いの...