Nature サブ出版物: 訓練されていないニューラルネットワークでも顔検出が可能

Nature サブ出版物: 訓練されていないニューラルネットワークでも顔検出が可能

Nature Communications に最近発表された新しい研究によると、高度な視覚認知機能は訓練されていないニューラル ネットワークでも自然に発生する可能性があり、顔画像に対する視覚選択性は完全に訓練されていないディープ ニューラル ネットワークでも発生する可能性があることがわかりました。

顔を検出して認識する能力は、動物の社会的行動(集団生活を維持するために集団内の異なるメンバーが協力して行う行動)にとって非常に重要です。この能力は、単一ニューロンまたは複数ニューロンレベルでのニューロンチューニング(感覚、協調、運動、認知などの情報を選択的に表現するニューロンの特性)に由来すると考えられています。

科学者たちは、さまざまな種の若い動物の顔に選択的に反応するニューロンを観察し、白熱した議論を巻き起こしている。顔選択性ニューロンは脳に組み込まれているのか、それとも視覚的な経験に依存しているのか?

最近、韓国科学技術院(KAIST)バイオ脳工学科のペク・セボム教授率いる研究チームが、この問題に関して非常に参考になる成果を発表しました。彼らは、まったく訓練されていないディープニューラルネットワークでも顔の画像に対して視覚的な選択性を生み出すことができることを発見した。具体的には、学習がまったく行われていない状態で、ランダムに初期化されたディープニューラルネットワークにおけるニューロン活動が観察され、顔画像が選択され、生物学的脳で観察されるものと同様の特徴が示されました。

この新たな研究はネイチャー・コミュニケーションズ誌の12月号に掲載された。これは、生物学的および人工的なニューラル ネットワークにおける認知機能の発達の基盤となるメカニズムについて明快な洞察を提供するとともに、初期脳機能 (感覚経験以前) の起源についての理解にも大きな影響を与えます。

論文リンク: https://www.nature.com/articles/s41467-021-27606-9.pdf

研究チームは、視覚皮質の腹側ストリームの特性を捉えたモデルニューラルネットワークである AlexNet45 を使用して、ランダムに初期化された DNN のさまざまな条件下で顔の選択性が確実に現れることを発見しました。さらに、顔選択指数(FSI)は、脳内で観察される顔選択性ニューロンのものと同等でした。

逆相関 (RC) 法と生成的敵対ネットワークの助けを借りて得られた優先特徴画像は、顔選択ユニットが非選択ユニットとは異なり、顔のような構成に対して選択的であることを示しています。さらに、顔選択ユニットにより、ネットワークは顔検出を実行できるようになります。

興味深いことに、研究者らは、顔以外のさまざまなオブジェクトに対するユニット選択性が、訓練されていないニューラル ネットワークでも自然に発生する可能性があることも発見しました。つまり、顔選択性は特別な種類の視覚調整ではないかもしれませんが、さまざまなオブジェクト カテゴリに対する選択性は、訓練されていない DNN でも自然に発生し、ランダムなフィードフォワード接続によって自発的に生成される可能性があります。

これらの結果は、初期の未訓練ネットワークで開発されたランダムなフィードフォワード接続が、原始的な視覚認知機能を初期化するのに十分である可能性があるシナリオを示唆しています。

パイク教授は次のように述べた。「私たちの研究結果は、学習がまったく行われていない場合でも、階層的なフィードフォワード投影回路に埋め込まれた統計的複雑性から、生来の認知機能が自発的に出現する可能性があることを示唆しています。私たちの研究結果は、生物学的および人工的なニューラル ネットワークにおける生来の機能の発達の背後にあるメカニズムについて、幅広い概念的進歩と洞察をもたらし、知能の出現と進化の謎を解明するのに役立つ可能性があります。」

<<:  科学研究ビッグデータにおける人工知能技術の応用

>>:  自動運転事故を回避するために、CV 分野では物理的な攻撃をどのように検出できるでしょうか?

ブログ    
ブログ    

推薦する

次世代ビッグデータ・人工知能基盤技術の発展と動向

2018 年はオープンソース ソフトウェアの歴史の中で最もエキサイティングな年でした。2 件の IP...

3D AI が新しい遊び方を生み出します。何時間もかかる代わりに、1 枚の写真からわずか 45 秒で 3D モデルを生成できます。

3D AI生成は近年急速に発展しており、最新の作品の多くは文章・画像から高品質な3Dモデルを生成で...

AIを活用して企業に利益をもたらすにはどうすればいいでしょうか?答えはすべてあなたのためにあります

人工知能 (AI) と機械学習 (ML) は成長サイクルのピークにあるかもしれませんが、だからといっ...

...

ユーザーの旅行需要予測

1. 背景と課題1. 背景Fliggy アプリ、Alipay、Taobao では、航空券、鉄道チケッ...

科学者らは脳の信号を読み取り「操作」できる新たな神経電子システムを開発

海外メディアの報道によると、コロンビア大学の研究チームは、脳の信号を「操作」し、病的な結合を阻害でき...

...

美団におけるナレッジグラフ可視化技術の実践と探究

著者 | 魏耀成魏ナレッジ グラフの視覚化により、ナレッジ グラフ データをより直感的に表示および分...

WPS AIは正式に公開され、WPSスマートドキュメントに初めて適用されました。

9月5日、Kingsoft OfficeはWPS AIを正式に公開したと発表しました。AI機能はま...

20B大型モデルの性能はLlama2-70Bに匹敵します!完全にオープンソースで、ベースからツールまですべてが明確に整理されています

たった今、国産オープンソースモデルのパラメータ数の記録がまた更新されました! 9月20日、上海人工知...

...

AIに感情を与えることは本当に重要なのでしょうか?

「合成感情」は人工知能の発展を妨げるのか?私たちは他の人とコミュニケーションをとるとき、通常は直接...

Jupyter Notebookの3つの大きな欠点は、この新しいツールによってすべて補われています。

Jupyter は、機械学習とデータサイエンスの分野でよく知られるようになりました。メモ、コード、...

Java プログラミング スキル - データ構造とアルゴリズム「バランス バイナリ ツリー」

[[390860]]バイナリソートツリーで起こりうる問題シーケンス {1,2,3,4,5,6} が...