Nature サブ出版物: 訓練されていないニューラルネットワークでも顔検出が可能

Nature サブ出版物: 訓練されていないニューラルネットワークでも顔検出が可能

Nature Communications に最近発表された新しい研究によると、高度な視覚認知機能は訓練されていないニューラル ネットワークでも自然に発生する可能性があり、顔画像に対する視覚選択性は完全に訓練されていないディープ ニューラル ネットワークでも発生する可能性があることがわかりました。

顔を検出して認識する能力は、動物の社会的行動(集団生活を維持するために集団内の異なるメンバーが協力して行う行動)にとって非常に重要です。この能力は、単一ニューロンまたは複数ニューロンレベルでのニューロンチューニング(感覚、協調、運動、認知などの情報を選択的に表現するニューロンの特性)に由来すると考えられています。

科学者たちは、さまざまな種の若い動物の顔に選択的に反応するニューロンを観察し、白熱した議論を巻き起こしている。顔選択性ニューロンは脳に組み込まれているのか、それとも視覚的な経験に依存しているのか?

最近、韓国科学技術院(KAIST)バイオ脳工学科のペク・セボム教授率いる研究チームが、この問題に関して非常に参考になる成果を発表しました。彼らは、まったく訓練されていないディープニューラルネットワークでも顔の画像に対して視覚的な選択性を生み出すことができることを発見した。具体的には、学習がまったく行われていない状態で、ランダムに初期化されたディープニューラルネットワークにおけるニューロン活動が観察され、顔画像が選択され、生物学的脳で観察されるものと同様の特徴が示されました。

この新たな研究はネイチャー・コミュニケーションズ誌の12月号に掲載された。これは、生物学的および人工的なニューラル ネットワークにおける認知機能の発達の基盤となるメカニズムについて明快な洞察を提供するとともに、初期脳機能 (感覚経験以前) の起源についての理解にも大きな影響を与えます。

論文リンク: https://www.nature.com/articles/s41467-021-27606-9.pdf

研究チームは、視覚皮質の腹側ストリームの特性を捉えたモデルニューラルネットワークである AlexNet45 を使用して、ランダムに初期化された DNN のさまざまな条件下で顔の選択性が確実に現れることを発見しました。さらに、顔選択指数(FSI)は、脳内で観察される顔選択性ニューロンのものと同等でした。

逆相関 (RC) 法と生成的敵対ネットワークの助けを借りて得られた優先特徴画像は、顔選択ユニットが非選択ユニットとは異なり、顔のような構成に対して選択的であることを示しています。さらに、顔選択ユニットにより、ネットワークは顔検出を実行できるようになります。

興味深いことに、研究者らは、顔以外のさまざまなオブジェクトに対するユニット選択性が、訓練されていないニューラル ネットワークでも自然に発生する可能性があることも発見しました。つまり、顔選択性は特別な種類の視覚調整ではないかもしれませんが、さまざまなオブジェクト カテゴリに対する選択性は、訓練されていない DNN でも自然に発生し、ランダムなフィードフォワード接続によって自発的に生成される可能性があります。

これらの結果は、初期の未訓練ネットワークで開発されたランダムなフィードフォワード接続が、原始的な視覚認知機能を初期化するのに十分である可能性があるシナリオを示唆しています。

パイク教授は次のように述べた。「私たちの研究結果は、学習がまったく行われていない場合でも、階層的なフィードフォワード投影回路に埋め込まれた統計的複雑性から、生来の認知機能が自発的に出現する可能性があることを示唆しています。私たちの研究結果は、生物学的および人工的なニューラル ネットワークにおける生来の機能の発達の背後にあるメカニズムについて、幅広い概念的進歩と洞察をもたらし、知能の出現と進化の謎を解明するのに役立つ可能性があります。」

<<:  科学研究ビッグデータにおける人工知能技術の応用

>>:  自動運転事故を回避するために、CV 分野では物理的な攻撃をどのように検出できるでしょうか?

ブログ    

推薦する

5 分間の技術講演 | 顔認識についてどれくらい知っていますか?

パート01 顔認識技術の概要顔認識技術は生体認証技術の一種で、人物の顔の特定の特徴(目、鼻、口、眉毛...

HKUST & MSRA リサーチ: 画像から画像への変換に必要なのは微調整だけ

多くのコンテンツ作成プロジェクトでは、単純なスケッチをリアルな絵に変換する必要があります。これには、...

GitHub ホットリスト 1 位: 数百万のトークン コンテキスト、動画も生成可能、カリフォルニア大学バークレー校制作

今日の GitHub ホット リストのトップは、最新のオープン ソース ワールド モデルです。コンテ...

Metaが人工知能チャットボット「Meta AI」をリリース

Meta は、Meta AI と呼ばれる人工知能チャットボットをリリースしました。ザッカーバーグ氏は...

ヘルスケア市場におけるサービスロボットは2027年までに32億ドルに達すると予想

[[434302]]ヘルスケア分野におけるロボットへの投資の増加が、医療サービスロボットの開発を促進...

あなたのリモート従業員は本当に彼自身でしょうか? FBI、ディープフェイクを悪用する求職者を明らかに

ディープフェイクの世界では、真実と虚偽を区別することが難しい場合があります。 AIアルゴリズム「ディ...

高度なランサムウェア攻撃によりAIによるサイバー防御の必要性が浮き彫りに

Deep Instinct の CIO である Carl Froggett 氏は、2024 年に予算...

ビジネスに適したRPAソフトウェアの選び方

[[407278]] RPA(ロボティック・プロセス・オートメーション)は、ビジネスユーザーを退屈で...

...

SAP、データスフィアプラットフォームを強化する新たな生成AI機能を発表

SAP は、生成 AI 向けの多数の新機能を発表しており、まもなく SAP Datasphere プ...

...

Pytorch Geometric を使用したリンク予測コードの例

PyTorch Geometric (PyG) は、グラフ ニューラル ネットワーク モデルを構築し...

...