中国科学院とディープマインドが協力し、ディープラーニングを使って脳が顔を認識する仕組みを解明

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

DeepMindと中国科学院神経科学研究所が協力した。

彼らは教師なしディープラーニングを用いて、脳が顔を認識するメカニズムを明らかにした。

具体的には、脳は顔の特徴を、年齢、性別、笑っているかどうかなどの意味的特徴に分解し、1 つのニューロンが特定の特徴に対応します。

さらに、彼らが構築したモデルは、少数のニューロンからの信号を使用して顔全体の画像を復元することができます。関連論文は、 Nature Communicationsの最新号に掲載されました。

論文の共著者は、ディープマインド社の研究者イリーナ・ヒギンズ氏と中国科学院神経科学研究所の研究者チャン・レ氏である。

他の参加者には、DeepMindの創設者ハサビス氏やカリフォルニア工科大学神経科学研究所所長のカオ・イン氏などが含まれる。

彼らの実験結果は、脳の視覚を単一ニューロンの規模で理解することが可能であることを示唆している。

この結果は、単一のニューロンはほとんど解釈不可能であり、意味のある情報は多数のニューロンの相互作用的な組み合わせの中に存在するという従来の認識を打ち破るものであると言えます。

関連分野の学者も、この記事を注意深く研究すると述べました。なぜなら、この記事を読む前に「教師なしのディープラーニングで脳のあらゆるメカニズムを説明できるか？」と尋ねられたら、ためらうことなく「望みはない」と答えるだろうからです。

人工ニューロンはマカクザルのニューロンと強い相関関係がある

霊長類の脳は視覚情報を処理する驚くべき能力を備えており、数ミリ秒以内に複雑なシーンを認識して反応することができます。

しかし、この能力の具体的な動作メカニズムは十分に研究されていません。

中国科学院のチャン・レ氏とカリフォルニア工科大学のカオ・イン氏はこれまでにマカクザルの視覚メカニズムを研究し、マカクザルの脳にある下側頭葉皮質の部分が顔の認識を担っていることを発見した。

DeepMind との今回のコラボレーションでは、顔認識を担う脳のモジュールをシミュレートするために、自己教師ありのβ-VAE (β 変分オートエンコーダ) を選択しました。

研究者らは、β-VAE モデルの動作をマカクザルの神経活動データと比較したところ、実際のニューロンと人工ニューロンの間に強い一対一のマッピングがあることを発見した。

現在、脳のメカニズムを研究するのは簡単ではありませんが、VAE の原理は非常に明確です。

エンコーダーは、入力データを潜在空間内のオブジェクトのサイズ、色、位置などのさまざまな特徴にエンコードし、デコーダーによって再構築します。

この能力は「デカップリング」または「分離」と呼ばれ、β-VAE はより強力なデカップリング能力を備えた VAE の変種です。

顔認識についても同様です。

年齢や性別から、目と目の距離や眉毛の太さなどのより具体的な詳細まで、すべてが個々の特徴に細分化されます。

β-VAE とマカクザルのニューロンの間に強い相関関係があることは、生物学的脳が顔をこのように認識する可能性が高いことを意味します。

これを検証するために、研究者らはマカクザルのニューロンからの測定データを用いてβ-VAEを訓練し、人間の顔を再構築することに成功した。

最終的に、研究チームは、機械学習から得られた最新の知見が神経科学にフィードバックされ、顔認識以外のタスク、特に抽象的推論や一般的なタスク学習に一般化されることを期待しています。

著者について

この記事の共同筆頭著者兼責任著者であるイリーナ・ヒギンズは、DeepMind の研究者であり、β-VAE モデル論文の筆頭著者です。

共同筆頭著者のChang Le氏は、中国科学院神経科学研究所の研究者です。彼の研究分野は、機能的 MRI、電気生理学的記録、数学的モデリングを組み合わせて、さまざまな種類の物体がマカクザルの下側頭葉皮質でどのように表現されるかを研究することです。

Chang Le 氏は、Caltech のポスドク研究員時代にCao Ying 氏とともに研究を行っていました。

曹英氏は2017年より、カリフォルニア工科大学の陳天橋・羅千千神経科学研究所の所長を務めています。2018年にはマッカーサー・ジーニアス・グラントを受賞し、2020年には米国科学アカデミーの会員に選出されました。

紙の住所
https://www.nature.com/articles/s41467-021-26751-5

<<: 何開明は2年ぶりに新たな論文を発表した。大規模な視覚モデルへの道を開くこの論文には、1つの数式も含まれていない。

>>: 機械学習のトレーニングをより安価かつ効率的にする方法

ハッカーはAIの顔を変える技術を使って就職活動を行っている。人工知能のセキュリティ問題は無視できない

ブログ

中国科学院とディープマインドが協力し、ディープラーニングを使って脳が顔を認識する仕組みを解明

人工ニューロンはマカクザルのニューロンと強い相関関係がある

著者について

ハッカーはAIの顔を変える技術を使って就職活動を行っている。人工知能のセキュリティ問題は無視できない

Python とディープニューラルネットワークを使用して画像を認識する方法は?

AI を活用することで、銀行は年間 1 兆ドルの追加収益を得ることができる | マッキンゼーの最新調査レポート

「スラムダンク」は、ヒューマノイドロボットをシミュレートし、人間のバスケットボールの動きを1対1でコピーします。特定のタスクに対する報酬を必要とせず、一度見るだけで習得できます。

人工知能の時代に人権と民主主義をどう守るか

転移学習とクロスドメイン推奨、およびクロスドメイン推奨のソリューション

DrivingGaussian: リアルなサラウンドビューデータ、運転シーンの再構成SOTA

推薦する

ロボット工学が環境に優しい建物にどのように役立つか

任正非氏、人工知能の応用について語る：すべてをインテリジェントにしてはいけない、さもないとすべてが失敗する

アリババクラウド＋新たな実体経済データ、人工知能の第二の60年を巡る戦い

人気のディープラーニングライブラリ23選のランキング

【ディープラーニング連載】畳み込みニューラルネットワーク（CNN）の原理を徹底解説（I） - 基本原理

Redis に基づく分散ロックと Redlock アルゴリズム

AIが地震の前兆信号を識別？機械学習がデータ内の不思議な相関関係を発見、人類に地震予測の希望を与える

AIは人類にとって脅威でしょうか？人工知能には強いものと弱いものがあるが、本当の危険は強い人工知能である

Google は、Bard が無料の RAW 写真と無制限の補充を提供することを公式に発表し、ネットユーザーたちは大喜びしています。トップモデルのメレーを実際に試す

人工知能の実用化を加速させるには