この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 最近、シンガポール国立大学、ByteDance Intelligent Creation Singapore Teamなどが共同で開発した技術成果が、世界トップの学術誌「ネイチャー」の子会社である「ネイチャー ニューロサイエンス」に掲載されました。この研究は、人工知能分野のメタ学習手法を神経科学と医学の分野に初めて導入したものであり、限られた医療データで信頼性の高いAIモデルを訓練し、脳画像に基づく精密医療を向上させることができる。 背景脳イメージング技術は神経科学の発展における重要な分野であり、脳が情報を処理し、刺激に反応する際の神経化学変化を直接観察できるため、病気の診断と治療に重要な参考資料を提供します。理論的には、脳画像に基づく機械学習モデルは、流動性知能や臨床結果など、個人の脳画像では表せない表現型を予測するために適用でき、それによって個人に対する精密医療を促進することができます。 現実的な問題として、現在では UK バイオバンクなどの大規模なヒト神経科学データセットが存在するものの、臨床集団を研究したり、主要な神経科学の問題を解決したりする際には、数十人から数百人規模の小規模なデータサンプルが依然として標準となっていることが挙げられます。正確にラベル付けされた医療データの量が限られているため、個々の表現特性を予測する信頼性の高い機械学習モデルをトレーニングすることは困難です。 この論文では、このデータ不足によってもたらされる根本的な制限に対処するための新しいアイデアを提案しています。つまり、複数の表現特徴が注釈付けされた大規模 (N>10,000) の脳画像データセットが与えられた場合、このデータセットでトレーニングされた機械学習モデルを、新しい表現特徴を持つ独立した小規模 (N<200) データセットに移行し、新しいデータセットでトレーニングされたモデルが新しい表現特徴を正確に予測できるようにするというものです。 方法研究者らは、以前の小規模なサンプルデータを分析することで、認知、精神的健康、人口統計、その他の健康属性などの個人の特性と脳画像データの間には固有の相関関係があることを発見した。これは、小規模データセット内のいくつかのユニークな表現型が、大規模データセット内の既存の特定の表現型に関連している可能性があることを意味します。この相関関係を利用して、研究者は新しいメタ学習ベースのメタマッチング法を提案し、大規模な脳イメージングデータセットを使用して小規模データセット内のいくつかの新しい未知の表現型の予測を促進するフレームワークメカニズムを確立し、それによって特徴予測を特徴付けるための信頼性の高い機械学習モデルをトレーニングしました。 この論文では、小規模データセットでの表現特徴予測モデルのトレーニングの問題を解決するための新しいメタマッチング手法を提案しています。メタマッチングは、さまざまな機械学習手法に使用できる非常に柔軟な学習フレームワークです。この論文では、主にカーネルリッジ回帰 (KRR) と完全接続型ディープニューラルネットワーク (DNN) へのメタマッチング手法の適用について研究します。 メタマッチング学習フレームワークでは、大規模なトレーニング データがトレーニング メタセットとテスト メタセットに分割されます。 2 つのデータセットには、異なる個別機能と特性機能の注釈が含まれています。メタトレーニング セットは DNN 予測モデルのトレーニングに使用され、メタテスト セットは新しい表現機能に対する現在の DNN モデルの予測精度 (つまり、一般化パフォーマンス) を評価するために使用されます。具体的には、ランダムに選択された K 個(K < 5)の個別データがテストサンプルとして選択されます。メタテスト セットで最高のパフォーマンスを発揮した DNN 出力ノードは保持され、他のノードは削除されます。次に、保持されたノードと、そのノードに以前接続されていた DNN モデルの隠れ層パラメータが、K テスト個別データに対して微調整されます。一般的なメタ学習や微調整戦略とは異なり、ここではモデルパラメータ全体を微調整するのではなく、DNN モデル内のサブネットワークのみが微調整されることに注意してください。このプロセスは、DNN モデルがメタテスト セットで安定を予測するまで M 回繰り返されます。 上記のメタトレーニングプロセスを完了すると、得られた DNN モデルは新しい予測タスクに対して強力な一般化能力を持つようになります。モデルを新しい特徴表現データセットに直接転送し、少数のラベル付きサンプルでトレーニングすることで、優れた予測パフォーマンスを実現できます。 実験のセットアップこの論文は、UKバイオバンクとヒューマンコネクトームプロジェクトのデータセットに基づいて評価されました。すべてのデータの使用は、関連する研究部門によって承認されています。 UK バイオバンクには、36,848 人の参加者の構造 MRI と安静時 fMRI 脳画像データのほか、67 のスクリーニングされた非脳画像特徴が含まれています。 HCP には、1,019 人の参加者からの構造 MRI および安静時 fMRI データと、選択された 58 個の表現特徴が含まれています。選択された表現特性には、認知、感情、性格が含まれます。 UK Biobank データセットは、メタマッチングを使用した予測モデルのトレーニング セットとして使用されました。これは、メタトレーニング セット (参加者 26,848 人、表現機能 33 個) とメタテスト セット (参加者 10,000 人、表現機能 34 個) にランダムに分割されました。 HCP データセットは、新しい表現機能に対する予測モデルの予測精度をテストするためのテスト セットとして使用されます。参加者はランダムにトレーニング用の K 人、テスト用の (1,019-K) 人の参加者に分けられました。 Kの値は19、20、50、100、200です。 △図 HCPデータセットテーブルの形状特性の例実験的結論このアプローチは、英国バイオバンクの 36,848 人の参加者と、ヒューマン コネクトーム プロジェクトの 1,019 人の参加者のサンプルを評価する際に効果的であることが示されています。 BioBank テスト セットで従来のカーネル リッジ回帰 (KRR) を上回るパフォーマンスを実現下の図は、UK Biobank メタテスト セットにおけるピアソンの相関係数に基づく精度の比較を示しています。提案されたメタマッチング法は、すべてのサンプルサイズ設定(K値)において、34の表現特徴(偽発見率FDR q<0.05)で従来のKRR法を大幅に上回ります。たとえば、fMRI研究で一般的なサンプルサイズK=20(20ショット)の場合、基本的なDNNメタマッチング法はKRRより100%(0.124対0.052)優れています。また、決定係数(COD)をパフォーマンスメトリックとして使用すると、DNNメタマッチング法はKRRより400%優れています。 小規模な新しいHCPデータセットでKRRを大幅に上回るまったく新しいテスト セットでのメタマッチングのパフォーマンスをテストするために、この論文では HCP データセットでのパフォーマンスをさらにテストしました。提案されたメタマッチング法は、従来の KRR 法よりも大幅に高い精度を持つことがわかりました。たとえば、K=20 の場合、メタマッチング法の精度は KRR を 100% 超えます (0.123 対 0.047)。K=100 の場合、COD を指標として使用すると、メタマッチング法の精度は KRR を 800% 超えます。 議論と結論提案されたメタマッチング法は表現特徴間の相関関係を利用して予測を支援することを考慮すると、その背後にある予測メカニズムは非因果的である可能性が高い。そして、この研究の主な目的は予測精度を向上させることであり、因果関係のない予測の場合でも、結果として得られる予測モデルには多くの応用シナリオがあります。たとえば、抗うつ薬が効き始めるまでには少なくとも 4 週間かかり、初回の投与で良好な反応を示す患者は 50% 未満です。したがって、たとえ因果関係がなくても、特徴の予測力を向上させることは、臨床的に大きな価値があります。 本論文で提案されているメタマッチング手法は、機械学習分野におけるメタ学習、マルチタスク学習、転移学習に基づいています。たとえば、DNN モデルをトレーニングして微調整することは、転移学習の一形態と考えることができます。しかし、実験により、精度の最大の改善は論文で提案されたコアアルゴリズムであるメタマッチングによってもたらされることが示されていることは注目に値します。もちろん、より高度な機械学習アルゴリズムにより、この方向での予測精度はさらに向上すると期待されています。 初期の脳画像データセットは若くて健康な成人のものでしたが、現在では高齢者、子供、さまざまな病気など、さまざまな集団に焦点を当てたデータセットが増えています。この論文で提案された方法は、将来的には、メンタルヘルスの症状を含む最近の ABCD データセットなど、他の人口データセットの表現特性を予測するためにも使用できます。 ByteDanceの知能創造チームは、ByteDanceのオーディオとビデオの革新技術とビジネスミドルプラットフォームであり、機械学習、コンピュータービジョン、グラフィックス、音声、撮影と編集、特殊効果、クライアントとサーバーエンジニアリングなどの技術分野をカバーしています。部門内の最先端のアルゴリズム、エンジニアリングシステム、製品のリンク全体のクローズドループを実現し、社内のビジネスラインと外部の協力顧客に、業界をリードするコンテンツ理解、コンテンツ作成、インタラクティブな体験と消費機能、およびさまざまな形式での業界ソリューションを提供することを目指しています。 インテリジェントクリエイションの基礎研究チームは、最先端の機械学習、コンピュータービジョン、自然言語処理技術を研究し、人工知能分野における困難な問題を解決することを目指しています。 Nature Neuroscience は、神経生物学の分野でトップクラスのジャーナルの 1 つです。このジャーナルに掲載される論文は、分子、細胞、システム、行動、認知、計算研究を含む神経科学のあらゆる分野を網羅しています。 |
>>: 深い知識の 6 つの次元: 人工知能に世界を真に理解させるにはどうすればよいでしょうか?
アシュトーシュ・グプタ翻訳者: ブガッティ企画丨孫淑娥亮策要するに:人工知能 (AI) プロジェクト...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
ガートナーの最新予測によると、人工知能(AI)パーソナルコンピュータ(PC)と生成型人工知能(ジェネ...
私は 51CTO アカデミーの講師、Jia Zhigang です。51CTO アカデミーの「4.20...
触覚は人間が相互作用を調整する主な方法の 1 つです。触覚を通じて知覚される触覚は、人間が物体の大き...
翻訳者|朱 仙中レビュー | Chonglou導入信頼性の高いモデル評価はMLOP と LLMop ...
編集者注: サンスティーンは『インターネット共和国』でアルゴリズムが私たちの認知世界に影響を与えると...
[[315132]]中国科学技術院発展戦略研究員 李秀全氏へのインタビュー第1次、第2次、第3次産業...
人工知能は世界を変えようとしていますが、問題は、それがどのように起こるのか誰も正確には知らないことで...
[[201234]]編集者注: 人工知能は多くの人の仕事を奪うだろう、これはメディアの報道でも事実...
AI を活用して財務管理や投資を行いたいと考えていますか? [[351941]]好むと好まざるとにか...
10 種類以上のチップが発売され、多くの合併や買収が行われています。これは、過去 500 日間の中国...