MITが提案:医療モニタリングのためのベイジアンディープラーニングの導入

MITが提案:医療モニタリングのためのベイジアンディープラーニングの導入

紙:

http://wanghao.in/paper/NatureMedicine21_MSA.pdf

ベイズの定式化とアルゴリズムの詳細:

http://wanghao.in/BayesDL4MSA.html

ベイジアンディープラーニング調査:

出典:http://wanghao.in/paper/CSUR20_BDL.pdf

ベイジアンディープラーニング Github リポジトリ:

https://github.com/js05212/BayesianDeepLearning-Survey/blob/master/README.md

私たちが Nature Medicine に発表した研究についてお話ししましょう。これは私が MIT 在籍中に取り組んだ最も興味深い研究の 1 つです。この投稿が、健康モニタリングにおける機械学習(特にベイジアンディープラーニング)の応用を誰もが理解するためのデータポイントとなることを願っています。

1. 応用シナリオ

簡単に言えば(SF)、私たちが作ったシステムは、家の中のWiFi信号を感知することで、患者が医師の指示に従って、インスリンペンや定量噴霧式吸入器などの医療器具を時間通りに使用して自己治療しているかどうかを監視できます。これらの医療機器の使用は少々複雑なため(例えば、インスリンペンは 8 ステップ、定量噴霧式吸入器は 6 ステップ)、患者が使用中にミスをしてしまうことがよくあります。当社のシステムでは、患者が手順を忘れたり、正しく実行しなかったりしたかどうかを自動的に検出することもできます。私たちはこのアプリケーションを「薬剤自己投与」(または MSA)と呼んでいます。具体的な使用シナリオを下図に示します。

インスリンペンと定量噴霧式吸入器の使用手順については、下の図をご覧ください。

2.連続時間領域における確率的推論

機械学習に精通している学生なら、この問題が実際にはより複雑な確率的推論の問題であることに気付いたかもしれません。

1. ステップによって所要時間は異なります。たとえば、図 4a では、ステップ 1 の「ツールを手に取る」は通常約 4 秒しかかかりませんが、ステップ 6 の「薬を塗って保持する」は通常約 12 秒かかります。したがって、異なるステップの期間は異なる確率分布に従うと考えられます。下記の通りです。そして、私たちのモデルは、この事前の知識を統合する必要があります。

2. 異なるステップ間の空白時間は長くても短くてもかまいません (上記の緑の中央の白い領域など)。

3. 患者は重要な手順を忘れてしまうことがよくあります。たとえば、インスリンペン(上の写真参照)の場合、患者がよく忘れる手順は、ステップ 2「カートリッジの装着」とステップ 4「インスリンペンの準備」です。この時点で、インスリン ペンのプロセス全体を、以下に示すように有限状態マシンに描画できます。図のステップ 1 からの 2 つの「50%」パスは、患者がステップ 2 を忘れて直接ステップ 3 に進む確率が 50% (事前確率) あることを示しています。これは、モデルが統合する必要がある事前知識でもあります。

3.ベイジアンディープラーニング

(ディープラーニングと確率推論の組み合わせ)

技術的な観点から、この研究では、基盤となる FMCW レーダーの知覚とトップレベルの連続時間 BayesNet 推論を組み合わせて、慢性疾患患者がインスリンペンや吸入器などの医療ツールを時間どおりに使用して治療しているかどうかを 24 時間非接触で推測し、特定の使用手順で異常を自動的に検出できるベイジアン ディープラーニング モデルを作成しました。システム全体のフローチャートは以下のようになります。

これには 2 つのリンクされたモデルが含まれます。

最初のモデルは、Wi-Fi のような信号 (基礎となる FMCW レーダー信号) を処理するために使用されるディープ ニューラル ネットワークです。これは、上図のステージ 1 とステージ 2 の統合に相当します。このディープモデルの入力は、数分間続くレーダー信号の多数のフレーム (上図の最初の行を参照) であり、出力は、各フレームが異なるステップに属する確率 (上図のステージ 2 の出力を参照) です。つまり、投薬プロセスに 6 つのステップが含まれている場合、各フレームの出力は 6 次元ベクトルになり、これらの 6 次元の数値の合計は常に 1 になります。

2 番目のモデルは、上図のステージ 3 に相当します。ステージ 2 の生の確率スコアに基づいて、前述の「連続時間領域での確率推論」を組み合わせて、さらに確率推論を実行し、最終的な予測を出力します (上図の最後の行を参照)。

これら 2 つのモデルのうち 1 つは、高次元信号の処理を担当するディープ モジュール (知覚モジュールとも呼ばれる)として機能し、もう 1 つは、タスク関連の確率推論の実行を担当する確率推論モジュール (タスク モジュールとも呼ばれる)として機能します。 2 つのモジュールはエンドツーエンドで連携して動作することができ、これをベイジアン ディープラーニングと呼びます。

興味のある学生は、「ベイジアン深層学習に関する調査」をご覧ください。

出典:http://wanghao.in/paper/CSUR20_BDL.pdf

4.ディープラーニングとベイジアンディープラーニング

それで疑問なのは、なぜここで 2 番目のモデルのリンクが必要なのかということです。最初のモデルを直接使用して問題を解決できないのはなぜですか?

これは、ディープ ニューラル ネットワークとしての最初のモデルは、各フレームに対して独立した確率予測を行うことのみを担当し、推論のためにフレームの前の部分と次の部分を組み合わせることができないためです。 その結果、直接出力されるフレームごとの予測は、多くの場合、意味をなさないものになります。たとえば、次のような予測が出力されることがあります: 最初の 0.1 秒では、患者はステップ 3 でまだデバイスを使用しており、次の 0.1 秒でステップ 1 に直接戻り、次の 0.1 秒で再びステップ 4 に戻ります。普通の人間がこのような一連の動作を実行することは明らかに不可能です。したがって、2 番目のモデルの役割は、連続時間領域における事前の知識 (前のセクション「連続時間領域における確率的推論」で説明した 3 つの側面) をモデルに統合し、エンドツーエンドの推論を実行して、最終的な予測を取得することです。確率的推論とディープラーニングを組み合わせたこのフレームワーク全体をベイズディープラーニングと呼びます。

これを行うと、2 つの利点があります。最初の側面は、モデルの精度と堅牢性を大幅に向上させることです。確率的推論の存在により、モデルは数分間の行動シーケンス全体に基づいて、患者が医療用投薬ツールを使用しているかどうかを判断します。これにより、最初のモデルの誤った予測の一部が自動的に修正されるだけでなく、無関係なノイズがシステム全体に与える影響が大幅に軽減されます。 2 番目の側面は、モデルに解釈可能性を提供することです。 @kkhenry が言ったように、説明可能性は、AI システムのユーザー (医師やその他の医療従事者) がモデルの予測を信頼できるかどうかに関係するため、医療アプリケーションでは非常に重要です。確率推論部分では、各ステップの予測の確率と、モデル予測が事前知識からどの程度逸脱しているかを示し、説明を提供することができます。たとえば、モデルは「この患者は午前 9 時に医療用具を使用したが、使い方が間違っていた」と結論付け、「これは、モデルが患者がステップ 2 をスキップしたと 95% 確信しているためです」と説明できます。医師は、モデルによって提供された説明に基づいて、患者の特定のデータをさらに調べて患者に注意を促すかどうかを決定できます。下記の通りです。

5. 技術的な詳細を組み合わせる方法

2つのモデルからの予測

出力に関しては、フレームごとに 2 つの予測が行われます。最初の予測は、最初のモデル (ディープラーニング モデル) によって提供されるフレーム レベルの予測から得られます。これは非常に単純で、ニューラル ネットワークが出力に対して Softmax 演算を実行した後に取得される各カテゴリの確率として理解できます。 2 番目の予測は、2 番目のモデル (確率推論モデル) から得られます。これは事前確率としてのランダムプロセスから来ています。具体的には、連続時間領域における点過程マルコフ連鎖の組み合わせです。点過程は各ステップ (ステップ 2 など) の長さをモデル化する役割を果たし、マルコフ連鎖はステップ間の遷移をモデル化する役割を果たします (たとえば、ステップ 1 を実行した後、ステップ 2 を実行する確率は 50%、ステップ 3 を実行する確率は 50% です)。

ここで興味深いのは、ポアソン過程などの一般的な点過程のみを使用する場合、各ステップの長さを適切にモデル化する方法がないということです。これは、ポアソン過程が各ステップの長さが指数分布であると仮定し、指数分布の期待値(平均)が決定されると(たとえば、a)、その分散も決定される(a^2 に等しい)ためです。したがって、分布の期待値と分散を自由に記述できるガウス分布ほど柔軟ではありません。そこで、私たちはアイデアを思いつき、モデルの事前分布の 1 つとして、ポアソン過程の指数分布をガウス分布に置き換えました。各ステップ期間のガウス分布の期待値と分散は異なりますが、これはトレーニング データから直接推定できます。

したがって、最初のモデル(ディープラーニングモデル)の予測スコアと 2 番目のモデルによって提供される事前スコアを直接組み合わせ、近似動的プログラミングアルゴリズムを追加して、共同(またはエンドツーエンド)確率推論を実行し、最終的な予測を取得します。下の図は、モデル予測 (AI 予測) と人間による注釈 (人間による注釈) の比較を示しています。最初の 3 つの例 (a、b、c) は、インスリン ペンを使用する 3 人の異なる患者で、合計 8 つのステップがあります。次の 3 つの例は、計 6 つの手順で定量噴霧式吸入器を使用する 3 人の異なる患者の例です。私たちのモデルの最終的な予測は非常に正確であり、物理的に不可能な予測はないことがわかります。

6. 最後に

この投稿全体は、機械学習(より具体的にはベイズ深層学習)とその医療への応用について語る出発点にすぎません。

最後に、この仕事に私を招待してくれた趙社長に感謝したいと思います。 MIT に入学したばかりの頃、ベイジアン ディープラーニングを医療に応用することを考えていたことを覚えています。ワイヤレス信号をモデル化するためにディープ モジュール (つまり、知覚モジュール) を使用し、医療関連の確率推論を実行するために確率モジュール (つまり、タスク モジュール) を使用するつもりだと言いました。結局それが実現するとは思っていませんでした。考え続ければ、必ず答えが出るとも言えます:)

Icons8 のMaria Shukshina によるイラスト

<<:  AIビデオ分析が業務を強化できる4つの方法

>>:  IBM Cloud Pak for Data 4.0 で大規模なインテリジェント オートメーションを統合

ブログ    

推薦する

人工知能搭載の携帯電話は私たちの生活をどのように変えるのでしょうか? 携帯電話メーカーが何をしてきたか見てみましょう。

チャットができる「インテリジェント音声アシスタント」から、さまざまな家電を操作できるスマートスピーカ...

...

AIビッグモデルがインテリジェント交通の未来を切り開く?

2023年の初め、OpenAIが開発したChatGPTの出現により、インターネット業界の微妙なバラ...

...

20世紀の最も偉大なアルゴリズム10選

参考: 20 世紀のベスト: 編集者が選ぶトップ 10 アルゴリズム。著者:バリー・A・シプラ。アド...

Sparkに代わると期待されるリアルタイム機械学習フレームワークRay

新しいプロジェクトは、Python で記述された機械学習アプリケーションをサポートするために使用でき...

ディープラーニング思考

[[195107]]機械学習ルーチンほとんどの機械学習アルゴリズム(ディープラーニングを含む)は、実...

人工知能の10年を振り返る: CNN、AlphaGo…世界をどのように変えたか

過去 10 年間に AI で達成された重要な進歩を振り返ります。人工知能技術は過去 10 年間で飛躍...

英国で新たな自動運転規制が導入され、ドライバーはもはや「集中」する必要がなくなった

自動運転は近年市場で最も活発なトピックの1つです。資金が継続的に流入し、大手企業が存在感を示そうと競...

マルチモーダル生体認証の利点は何ですか?

マルチモーダル生体認証とは何ですか? マルチモーダル生体認証は、さまざまなシナリオやセキュリティ レ...

皇帝の側室選定と推薦アルゴリズムの仕組み

[[393467]]この記事はWeChatの公開アカウント「Shu Shixiong」から転載したも...

...

機械学習アルゴリズムを使用して「実験室地震」を予測するにはどうすればよいでしょうか?

[[186458]]機械学習アルゴリズムが「実験室の地震」を予測できるという事実は、間違いなく画期...

5G自動運転はどのようなものになるのでしょうか?韓国のテストではこの結果が出た

自動運転と5Gの産業発展は大きな注目を集めており、韓国企業は最近、両者を組み合わせた効果を模索してい...