ネイチャーの表紙に掲載されているこのグループ学習は、中央コーディネーターを必要とせず、連合学習よりも優れています。

ネイチャーの表紙に掲載されているこのグループ学習は、中央コーディネーターを必要とせず、連合学習よりも優れています。

[[406170]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

現在、いくつかの病気の診断においては、AIの精度が医師の精度を上回っています

信頼性の高い診断結果の背後には、膨大なデータセットに基づく機械学習があります。

しかし、現実には、トレーニングに利用できる医療データは非常に分散しています。世界中からデータを収集しようとすると、データの所有権、プライバシー、機密性、セキュリティ、さらにはデータ独占の脅威に関する懸念が生じます...

フェデレーテッド ラーニングなどの一般的に使用される方法は、上記の問題の一部を解決できますが、モデルのパラメータは「中央コーディネーター」によって処理されるため、「電力」が集中し、スター アーキテクチャによってフォールト トレランスも低下します。

良い解決策はないのでしょうか?

はい、Nature の表紙に、 Swarm Learning (SL) と呼ばれる新しい機械学習手法が掲載されました。

このアプローチは、エッジコンピューティング、ブロックチェーンベースのピアツーピアネットワーク、そして「中央コーディネーター」の不在を組み合わせ、連合学習を超えて、プライバシー法に違反することなく世界中のあらゆる医療データを統合します。

研究者らは、4つの異種疾患(結核、COVID-19、白血病、肺病変)を用いて、分散データを使用して疾患を診断する群集学習法の実現可能性を検証した。

具体的にどうやって達成するのでしょうか?

グループ学習法は分散型アーキテクチャを採用し、プライベート許可ブロックチェーン技術を使用して実装されます。

Swarm ネットワーク全体は複数の Swarm エッジ ノードで構成され、各ノードはこれらのノードを通じてパラメータを共有します。各ノードは、プライベート データとネットワークによって提供されるモデルを使用して、独自のモデルをトレーニングします。

このアプローチは、プライベート許可ブロックチェーン技術を通じて、データの所有権、セキュリティ、機密性をサポートするセキュリティ対策を提供します。

その中で、参加できるのは事前に承認された参加者のみであり、新しいノードの参加は動的です。参加者は適切な承認措置を通じて識別され、ブロックチェーンのスマートコントラクトを通じて登録され、参加者はモデルを取得してローカルモデルのトレーニングを実行できます。

定義された同期条件を満たすようにローカル モデルがトレーニングされた後でのみ、Swarm API を介してモデル パラメーターを交換でき、新しいトレーニング ラウンドが開始される前に新しいパラメーター構成をマージしてモデルを更新できます。

△ グループ学習と他の機械学習手法のアーキテクチャ比較

したがって、グループ学習法には次のような特徴があります。

  • データ所有者の医療データはローカルに保存できます。
  • 生データを交換する必要がないため、データ トラフィックが削減されます。
  • 高いレベルのデータセキュリティ保護を提供できます。
  • 分散型メンバーのオンボーディングを安全かつ透明かつ公正に行うために中央管理者は必要ありません。
  • すべてのメンバーが同等の権限でパラメータをマージできるようにします。
  • 機械学習モデルを攻撃から保護します。

分散データに基づいて病気の診断機能を開発するこの方法の実現可能性を検証するために、研究者らはこれを使用して 4 つの病気を診断しました。

軽度と重度のCOVID-19を区別し、単一ノードを上回るパフォーマンスを発揮

まず、白血病。

研究者らは、世界中に分散している現実世界の医療センターをシミュレートするために、12,000 を超えるサンプル データ ポイントを個々のノードに「分離」しました。

次に、グループ学習を使用してデータをトレーニングし、未知の患者を診断しました。各ノードのサンプル分布がどのように変化しても、グループ学習法の診断精度は単一ノードの診断精度よりも優れていることがわかりました。

次に、グループ学習を使用して、結核または肺病変の患者を特定しました。結果は同じでした。トレーニング サンプルの数を減らすと、グループ学習の予測効果は低下しましたが、それでも単一のノードよりも優れていました。

流行後、研究者らは新型コロナウイルスの診断におけるグループ学習の有効性もテストした。

結果は、軽度と重度のCOVID-19の区別において群集学習が個々のノードよりも優れていることを示しました。

最後に、研究者らは、分散型学習法としてのグループ学習は、機関間の医療研究における現在のデータ共有モデルに取って代わり、データのプライバシーを確​​保しながらAIがより豊富で包括的なデータを取得するのに役立ち、それによってAIによる病気の診断の精度が向上すると期待されていると述べた。

論文の宛先:
https://www.nature.com/articles/s41586-021-03583-3

GitHub コード:

https://github.com/schultzelab/swarm_learning

<<:  しゃべるアバター!新しいフレームワークLipSync3Dは将来的に動的なリップシンクを可能にするかもしれない

>>:  ベンチャー投資における機械学習の活用方法

推薦する

OpenAI CEOがGPT-5の開発中であることを明らかに

11月14日、海外メディアの報道によると、OpenAIはGPT-5の構築を開始した。同社のCEOサム...

軍用ロボットは障害物を乗り越えるために車輪を使うか脚を使うかを決定できる

ロボットが環境内を移動するための最も効率的な方法の 1 つは、比較的滑らかな地形上で車輪を動かすこと...

人間の姿勢評価技術の開発と実装

[51CTO.com クイック翻訳]関連調査レポートによると、デジタルフィットネス市場の規模は202...

なぜ人工知能は過大評価されているのでしょうか?

他の新しいテクノロジーと同様に、AI もハイプ サイクルと呼ばれる段階を経ます。それらはテクノロジー...

機械学習における線形代数の理解に役立つ 10 の例

線形代数は、ベクトル、行列、線形変換を扱う数学の分野です。これは機械学習の重要な基盤であり、アルゴリ...

アンドリュー・ングのパレートの法則: データの 80% + モデルの 20% = より優れた機械学習

機械学習の進歩がモデルによってもたらされるのか、それともデータによってもたらされるのかは、今世紀の論...

2年半の訓練を経て、テスラのヒューマノイドロボット「オプティマス2」がオンラインになった。

何の前触れもなく、テスラのヒューマノイドロボット「オプティマス」の第2世代が登場しました。 12月1...

人間の農業の将来は主にロボットに依存することになるのでしょうか?基本的に人間の介入は必要ありません

予想外のことが起こらなければ、人類は人工知能の時代へと急速に進んでいくだろう。ウェイター、宅配便業者...

Google Gemini は Baidu を「騙し取っている」が、その背後にいる本当の犯人は誰なのか?

ノア著制作:51CTO テクノロジースタック(WeChat ID:blog)かつて AI の王者だっ...

...

ハイブリッドクラウド環境でディープラーニングを取り入れたID認証はより柔軟

[51CTO.com からのオリジナル記事] 入れ墨は、秦と漢の時代に広く使用されていた刑法の一種で...

女性用メイクアップムスク!超楽しいモデルStyleCLIPがオープンソースになりました。急いで自分の顔を変えてみましょう

[[421561]]マスク氏は科学研究に本当に多大な貢献をしてきました!最近、イスラエルの研究者が新...

推薦システムにおける大規模言語モデルの実用化

1. 背景と課題従来の推奨モデルのネットワークパラメータの影響は比較的小さく(埋め込みパラメータを除...

大規模製造企業におけるインテリジェントな意思決定シナリオの分析

1. 製造業の発展の現状まず、製造業企業の発展状況について紹介します。 1. 企業経営は直線的な発展...

...