ネイチャーの表紙に掲載されているこのグループ学習は、中央コーディネーターを必要とせず、連合学習よりも優れています。

ネイチャーの表紙に掲載されているこのグループ学習は、中央コーディネーターを必要とせず、連合学習よりも優れています。

[[406170]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

現在、いくつかの病気の診断においては、AIの精度が医師の精度を上回っています

信頼性の高い診断結果の背後には、膨大なデータセットに基づく機械学習があります。

しかし、現実には、トレーニングに利用できる医療データは非常に分散しています。世界中からデータを収集しようとすると、データの所有権、プライバシー、機密性、セキュリティ、さらにはデータ独占の脅威に関する懸念が生じます...

フェデレーテッド ラーニングなどの一般的に使用される方法は、上記の問題の一部を解決できますが、モデルのパラメータは「中央コーディネーター」によって処理されるため、「電力」が集中し、スター アーキテクチャによってフォールト トレランスも低下します。

良い解決策はないのでしょうか?

はい、Nature の表紙に、 Swarm Learning (SL) と呼ばれる新しい機械学習手法が掲載されました。

このアプローチは、エッジコンピューティング、ブロックチェーンベースのピアツーピアネットワーク、そして「中央コーディネーター」の不在を組み合わせ、連合学習を超えて、プライバシー法に違反することなく世界中のあらゆる医療データを統合します。

研究者らは、4つの異種疾患(結核、COVID-19、白血病、肺病変)を用いて、分散データを使用して疾患を診断する群集学習法の実現可能性を検証した。

具体的にどうやって達成するのでしょうか?

グループ学習法は分散型アーキテクチャを採用し、プライベート許可ブロックチェーン技術を使用して実装されます。

Swarm ネットワーク全体は複数の Swarm エッジ ノードで構成され、各ノードはこれらのノードを通じてパラメータを共有します。各ノードは、プライベート データとネットワークによって提供されるモデルを使用して、独自のモデルをトレーニングします。

このアプローチは、プライベート許可ブロックチェーン技術を通じて、データの所有権、セキュリティ、機密性をサポートするセキュリティ対策を提供します。

その中で、参加できるのは事前に承認された参加者のみであり、新しいノードの参加は動的です。参加者は適切な承認措置を通じて識別され、ブロックチェーンのスマートコントラクトを通じて登録され、参加者はモデルを取得してローカルモデルのトレーニングを実行できます。

定義された同期条件を満たすようにローカル モデルがトレーニングされた後でのみ、Swarm API を介してモデル パラメーターを交換でき、新しいトレーニング ラウンドが開始される前に新しいパラメーター構成をマージしてモデルを更新できます。

△ グループ学習と他の機械学習手法のアーキテクチャ比較

したがって、グループ学習法には次のような特徴があります。

  • データ所有者の医療データはローカルに保存できます。
  • 生データを交換する必要がないため、データ トラフィックが削減されます。
  • 高いレベルのデータセキュリティ保護を提供できます。
  • 分散型メンバーのオンボーディングを安全かつ透明かつ公正に行うために中央管理者は必要ありません。
  • すべてのメンバーが同等の権限でパラメータをマージできるようにします。
  • 機械学習モデルを攻撃から保護します。

分散データに基づいて病気の診断機能を開発するこの方法の実現可能性を検証するために、研究者らはこれを使用して 4 つの病気を診断しました。

軽度と重度のCOVID-19を区別し、単一ノードを上回るパフォーマンスを発揮

まず、白血病。

研究者らは、世界中に分散している現実世界の医療センターをシミュレートするために、12,000 を超えるサンプル データ ポイントを個々のノードに「分離」しました。

次に、グループ学習を使用してデータをトレーニングし、未知の患者を診断しました。各ノードのサンプル分布がどのように変化しても、グループ学習法の診断精度は単一ノードの診断精度よりも優れていることがわかりました。

次に、グループ学習を使用して、結核または肺病変の患者を特定しました。結果は同じでした。トレーニング サンプルの数を減らすと、グループ学習の予測効果は低下しましたが、それでも単一のノードよりも優れていました。

流行後、研究者らは新型コロナウイルスの診断におけるグループ学習の有効性もテストした。

結果は、軽度と重度のCOVID-19の区別において群集学習が個々のノードよりも優れていることを示しました。

最後に、研究者らは、分散型学習法としてのグループ学習は、機関間の医療研究における現在のデータ共有モデルに取って代わり、データのプライバシーを確​​保しながらAIがより豊富で包括的なデータを取得するのに役立ち、それによってAIによる病気の診断の精度が向上すると期待されていると述べた。

論文の宛先:
https://www.nature.com/articles/s41586-021-03583-3

GitHub コード:

https://github.com/schultzelab/swarm_learning

<<:  しゃべるアバター!新しいフレームワークLipSync3Dは将来的に動的なリップシンクを可能にするかもしれない

>>:  ベンチャー投資における機械学習の活用方法

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

PyTorch のデータセット Torchvision と Torchtext

[[421061]] PyTorch がさまざまな種類のデータを読み込んで処理できるように、公式で...

GoogleのAIチップ設計能力は人間より優れているのか?社内研究者が疑問を呈し解雇された

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

このAIは、監視カメラを素早く検索し、重要なシーンを見つけ、24時間のビデオを10分で処理するのに役立ちます。

1月23日のニュース、今日では、ビデオ監視の存在により、過去には検証が困難だった多くの事実を記録す...

サービスロボットは驚異的なユニコーンを生み出すことができるか?

サービスロボットはニッチな領域を超えつつあるようだ。まず、2018年の世界ロボット産業の市場規模は2...

目標を達成するために、Google AI は自身の体をこのように変形させました...

[[246219]]強化学習 AI がゲームをプレイすることは珍しくありません。インテリジェントエ...

Google、AIが出力コンテンツの正しさを自己判断できるモデルトレーニングフレームワーク「ASPIRE」をリリース

IT Homeは1月23日、Googleが最近、大規模言語モデル向けに特別に設計されたASPIREト...

スパムボットが誤って7億件のメールアドレスとパスワードを漏洩

海外メディアの報道によると、悪名高いスパムロボットが所有する7億件の電子メールアドレスと、使用してい...

ワークスペースデザインの未来: AI、3Dウォークスルー、リアルタイムコラボレーション

過去 10 年間で、スマート AI ツールの導入により、ワークスペースのデザインは完全に変化しました...

注目を浴びるAIとゲームは、どんな火花を散らすことができるのでしょうか?

[[202722]] 2005年、JJ Linは「Number 89757」で「人間を模倣した機械...

2020 年に AI テクノロジーはどのような変化をもたらすでしょうか?

近年、人工知能は頻繁に話題になっていますが、まだ真の実現には程遠い状況です。人工知能技術の開発におけ...

ドローンの将来の用途

ドローンは、1960年代以降、政府と軍隊によるインテリジェントな戦闘装備の需要から生まれました。米軍...

元アップル社員によって設立されたアルトマンは、同社初のAIハードウェアに投資し、ChatGPTへのアクセスをサポートした。

次に購入する電話はなぜ携帯電話であるべきなのでしょうか?ご覧のとおり、首輪にクリップするこの小さなガ...

旅行リスクの特定: AI ソリューションが世界の COVID-19 安全マップを作成

州や自治体が新型コロナウイルスから国民を守るために制限措置を講じてきたため、ほぼ2年間、あらゆる種類...