この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 DeepMindと中国科学院神経科学研究所が協力した。 彼らは教師なしディープラーニングを用いて、脳が顔を認識するメカニズムを明らかにした。 具体的には、脳は顔の特徴を、年齢、性別、笑っているかどうかなどの意味的特徴に分解し、1 つのニューロンが特定の特徴に対応します。 さらに、彼らが構築したモデルは、少数のニューロンからの信号を使用して顔全体の画像を復元することができます。関連論文は、 Nature Communicationsの最新号に掲載されました。 論文の共著者は、ディープマインド社の研究者イリーナ・ヒギンズ氏と中国科学院神経科学研究所の研究者チャン・レ氏である。 他の参加者には、DeepMindの創設者ハサビス氏やカリフォルニア工科大学神経科学研究所所長のカオ・イン氏などが含まれる。 彼らの実験結果は、脳の視覚を単一ニューロンの規模で理解することが可能であることを示唆している。 この結果は、単一のニューロンはほとんど解釈不可能であり、意味のある情報は多数のニューロンの相互作用的な組み合わせの中に存在するという従来の認識を打ち破るものであると言えます。 関連分野の学者も、この記事を注意深く研究すると述べました。なぜなら、この記事を読む前に「教師なしのディープラーニングで脳のあらゆるメカニズムを説明できるか?」と尋ねられたら、ためらうことなく「望みはない」と答えるだろうからです。 人工ニューロンはマカクザルのニューロンと強い相関関係がある霊長類の脳は視覚情報を処理する驚くべき能力を備えており、数ミリ秒以内に複雑なシーンを認識して反応することができます。 しかし、この能力の具体的な動作メカニズムは十分に研究されていません。 中国科学院のチャン・レ氏とカリフォルニア工科大学のカオ・イン氏はこれまでにマカクザルの視覚メカニズムを研究し、マカクザルの脳にある下側頭葉皮質の部分が顔の認識を担っていることを発見した。 DeepMind との今回のコラボレーションでは、顔認識を担う脳のモジュールをシミュレートするために、自己教師ありのβ-VAE (β 変分オートエンコーダ) を選択しました。 研究者らは、β-VAE モデルの動作をマカクザルの神経活動データと比較したところ、実際のニューロンと人工ニューロンの間に強い一対一のマッピングがあることを発見した。 現在、脳のメカニズムを研究するのは簡単ではありませんが、VAE の原理は非常に明確です。 エンコーダーは、入力データを潜在空間内のオブジェクトのサイズ、色、位置などのさまざまな特徴にエンコードし、デコーダーによって再構築します。 この能力は「デカップリング」または「分離」と呼ばれ、β-VAE はより強力なデカップリング能力を備えた VAE の変種です。 顔認識についても同様です。 年齢や性別から、目と目の距離や眉毛の太さなどのより具体的な詳細まで、すべてが個々の特徴に細分化されます。 β-VAE とマカクザルのニューロンの間に強い相関関係があることは、生物学的脳が顔をこのように認識する可能性が高いことを意味します。 これを検証するために、研究者らはマカクザルのニューロンからの測定データを用いてβ-VAEを訓練し、人間の顔を再構築することに成功した。 最終的に、研究チームは、機械学習から得られた最新の知見が神経科学にフィードバックされ、顔認識以外のタスク、特に抽象的推論や一般的なタスク学習に一般化されることを期待しています。 著者についてこの記事の共同筆頭著者兼責任著者であるイリーナ・ヒギンズは、DeepMind の研究者であり、β-VAE モデル論文の筆頭著者です。 共同筆頭著者のChang Le氏は、中国科学院神経科学研究所の研究者です。彼の研究分野は、機能的 MRI、電気生理学的記録、数学的モデリングを組み合わせて、さまざまな種類の物体がマカクザルの下側頭葉皮質でどのように表現されるかを研究することです。 Chang Le 氏は、Caltech のポスドク研究員時代にCao Ying 氏とともに研究を行っていました。 曹英氏は2017年より、カリフォルニア工科大学の陳天橋・羅千千神経科学研究所の所長を務めています。2018年にはマッカーサー・ジーニアス・グラントを受賞し、2020年には米国科学アカデミーの会員に選出されました。 紙の住所 |
<<: 何開明は2年ぶりに新たな論文を発表した。大規模な視覚モデルへの道を開くこの論文には、1つの数式も含まれていない。
>>: 機械学習のトレーニングをより安価かつ効率的にする方法
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
進化する人工知能により、電子商取引分野におけるウェブサイトのアクセシビリティ訴訟のリスクを最小限に抑...
論文リンク: https://arxiv.org/abs/1706.10207概要: この論文では、...
[[419760]] 「クラブアップルの木は、その赤みがかった色にもかかわらず、霧雨の中にひとりぼっ...
ザッカーバーグ氏は最近また大きなトラブルに巻き込まれた。リチャード・ブルーメンソール議員(プライバシ...
2020年12月にリリースされたCPM-1は、中国初の大型中国語モデルです。2022年9月にリリー...
ノア著制作:51CTO テクノロジースタック(WeChat ID:blog)最近、マイクロソフトは、...
生成AIとは何ですか?生成 AI は、データを分析し、パターンと傾向を識別し、都市計画と管理に関する...
PHP はまだ比較的よく使用されているので、PHP の再帰アルゴリズムを研究し、皆さんのお役に立てれ...
[51CTO.comよりオリジナル記事] 6月21日、WOT2019グローバル人工知能技術サミット...
統合と国境を越えた発展が進む今日の世界において、教育が象牙の塔に留まり、自己満足に浸っているだけでは...
生成アルゴリズム、事前トレーニング済みモデル、マルチモーダルなどの技術の累積的な統合と反復を経て、人...