数学モデルが人間の視覚の秘密を解き明かす

数学モデルが人間の視覚の秘密を解き明かす

人間の視覚はどのように発達するのでしょうか?今日に至るまで、それは謎のままです。脳の視覚系は、世界自体から非常に限られた情報しか受け取りません。つまり、私たちが「見る」もののほとんどは、主に私たちの想像力から来ているということです。

「私たちが見ていると思っているものの多くは脳によって再構成されているが、実際には私たちはそれを見ているわけではない」とニューヨーク大学の数学者、ライサン・ヤング氏は言う。

脳は視覚的な世界を創造する点で実に素晴らしいが、純粋に解剖学的な研究では、脳がこれらの画像をどのように創造するかを明らかにすることはできない。これは、車のエンジンをじっと見つめて熱力学の法則を解読しようとするのと同じような、本質的に難しい作業である。

そして新たな研究は、数学がこの問題を解決する鍵を握っているかもしれないことを示唆している。過去数年間、ヤング氏はニューヨーク大学の同僚である神経科学者ロバート・シャプレー氏と数学者ローガン・チャリカー氏と野心的なプロジェクトに協力してきた。彼らは協力して、長年の生物学的実験結果と組み合わせた単一の数学モデルを構築し、非常に限られた視覚情報に基づいて脳がどのようにして美しい視覚観察を生み出すのかを説明しています。

それぞれの実験に基本的な視覚要素を追加することで、視覚皮質のニューロンが相互作用して物体のエッジやコントラストの変化を検出する仕組みを説明しました。現在、研究者たちは、物体が動いている方向を脳がどのように感知するかを調査している。

これは、これまでに蓄積された人間の視覚実験材料に基づいて、視覚皮質の構造について合理的な仮定を立てる前例のない研究方法です。具体的には、ヤング、シャプレー、チャリカーは、視覚皮質に関する厳密かつ非直感的な生物学的結論を数学モデルに組み込み、視覚現象がどのように発生するかを統一的に説明しようとしました。

>>> 網膜と視覚皮質のつながりは非常に限られている

生物学によれば、私たちの目はレンズのような役割を担っており、外界からの光を受け取り、視野を比例して複製し、それを目の奥にある網膜に投影する役割を果たしています。網膜は、視覚を司る脳の後部にある視覚皮質に直接つながっています。

しかし、網膜と視覚皮質の間の接続は非常に限られています。この視覚領域は、地上から見ると満月の 4 分の 1 の大きさしかありませんが、その中には、網膜と視覚皮質をつなぐ神経細胞が 10 個ほどしかありません。これらの細胞は外側膝状体核(LGN)を構成します。これは視覚情報が外界から脳に伝達される唯一の方法です。

LGN セルは数が少ないだけでなく、機能も非常に貧弱です。 LGN 細胞は、視野のごく一部で暗から明(またはその逆)への変化を検出すると、視覚皮質にパルスを送信します。明るさが調整された視野は網膜に新しいデータを送信し始めますが、脳が実際に受信できるのは依然として LGN 細胞の小さな集合体によって送信される微弱な信号です。画像復元プロセス全体は、ナプキンに書かれた原稿の断片を使って小説を整理するようなものです。

「脳にマッピングされたものが、私たちの視野で見るものだと考える人もいるかもしれません」とヤング氏は言う。「しかし、実際には脳はそうは機能しません。マッピングは網膜の仕事ですが、網膜から視覚皮質に送られる情報はごくわずかです。」

皮質と網膜はほんの数個のニューロンでつながっていますが、皮質自体には豊富で密度の高い神経細胞があります。網膜に接続する LGN ニューロン 10 個ごとに、皮質の片側には、最初の「入力層」に 4,000 個の対応するニューロンがあります。この構造は、脳が受け取った視覚データを深く処理することを示唆しています。

ヤング、シャプレー、チャリカーのような研究者にとって、中心的な課題は脳の処理全体を解読することです。

>>> 視覚情報の伝達は「フィードフォワード」ループではなく「フィードバック」ループである

実際、ヤング、シャプレー、チャリカーは、数学モデルを使ってこの問題を解決しようとした最初の研究者ではありません。しかし、これまでの研究はすべて、網膜と視覚野の間により多くの情報伝達経路があると仮定しており、それによって視覚野が刺激に反応する原理についてより単純な説明が見出されているという違いがあります。

数学者は、ビリヤードのボールの軌道から空間と時間の進化に至るまで、変化をモデル化する問題に長年にわたり取り組んできました。これらは、いわゆる「動的システム」、つまり一定のルールに従って時間の経過とともに変化するシステムの直接的な現れです。脳内のニューロン間の相互作用も一種の動的システムです。ただ、そのニューロンが従うルールはより微妙で、決定するのが難しいだけです。

LGN 細胞は、わずか 10 分の 1 ボルトの電圧と 1 ミリ秒の持続時間で、視覚皮質に一連の電気パルスを送信できます。これらのパルスは、ニューロン間の一連の相互作用を引き起こす可能性があります。ヤング氏は、こうした相互作用のルールは、私たちがよく知っている物理システムと比較すると、ほぼ「無限に複雑」だと言う。

[[274916]]

▲ ニューヨーク大学の数学者、ライサン・ヤング氏

1 つのニューロンは同時に何百もの他のニューロンから信号を受け取ります。そのうちのいくつかはニューロンのさらなる発火を促し、他のいくつかはニューロンのさらなる発火を抑制します。ニューロンがこれらの興奮性および抑制性の電気インパルスを受け取ると、細胞膜間の電圧が変動します。電圧(または「膜電位」)が特定のしきい値を超えた場合にのみ、対応する反応がトリガーされます。そして現時点では、これがいつ起こるかを予測することはほぼ不可能です。

「ニューロン1個の膜電位を観察すると、上下に動いていることがわかります」とヤング氏は言う。「いつ発火しているかを正確に知る方法はありません。」

実際の状況はこれよりもはるかに複雑です。何百ものニューロンが 1 つのニューロンに接続されたらどうなるでしょうか?視覚皮質は、他の何百ものニューロンから常に信号を受信するため、このような無数のフィードバック ループで構成されています。

「問題は、このプロセスには多くの可動部分があり、それが根本的な課題だ」とシャプレー氏は語った。

視覚皮質の初期のモデルでは、この機能は無視される傾向がありました。当時、研究者たちは、情報は工場のベルトコンベアで部品を移すのと同じように、目の前から後ろの網膜へ、視覚野へ、そして最後に脳の後部の対応する領域へと一方向にしか流れないと信じていました。これらの「フィードフォワード」モデルは作成が簡単ですが、生体には基本的な構成要素として「フィードバック」ループがあるという解剖学の基本原則を無視しています。

「フィードバック ループは、情報が繰り返し戻ってきて変化を引き起こし、また戻ってきて新たな変化を引き起こすため、処理が非常に難しい」とヤング氏は言う。「さらに、こうしたループは脳内に遍在しており、既存のモデルで正確に処理できるものはほとんどありません。」

2016年に発表された最初の論文で、ヤング、シャプレー、チャリカーはこれらのフィードバック ループを真剣に受け止め始めました。彼らは、モデルのフィードバック ループにバタフライ効果に似たメカニズムを導入しました。LGN 細胞からの信号がマイクロ波の変化を受けた後、フィードバック ループを次々と通過して徐々に増幅されます。彼らはこのプロセスを「反復刺激」と呼び、最終モデルの視覚的結果に大きな影響を与える可能性があると考えています。

ヤング、シャプレー、チャリカーは、モデルに入力される弱い LGN 入力信号のわずかな変化に基づいて、リッチフィードバック モデルがオブジェクトのエッジの方向 (垂直から水平まで、その間のあらゆる方向) を再現できることを実証しました。

これは、科学者が他のニューロンに接続するごく少数のニューロンのみを使用して、視覚システムのすべての方向をマッピングできることを意味します。

しかし、エッジ検出は視覚システムのほんの一部に過ぎず、2016 年の論文はほんの始まりに過ぎません。次の課題は、以前の要素の実際の機能に影響を与えずに、モデルに視覚的な要素を追加する方法です。

「モデルが正しい答えを出しているなら、他のタスクもうまくこなせるはずだ」とヤング氏は言う。「まるで、私たちの脳が調整なしでさまざまな物体に異なる反応を示すようだ」

>>> 数学 + 生物学: 研究における重要な前進

実験室環境では、研究者らは霊長類にとって最も単純な視覚刺激コンテンツである白黒パターンを選択しました。白黒モードでは、調整できる変数は画像のコントラストと視野に入るオブジェクトの特定の方向のみです。研究者たちは霊長類の視覚皮質に電極を接続し、刺激に反応して生成される神経インパルスを追跡した。理想的なモデルは、同じ刺激に直面したときに同じタイプの出力パルスを与えることができるはずです。

[[274917]]

▲ ニューヨーク大学の神経科学者ロバート・シャプレー氏

「私たちはこの情報を入手し、霊長類に特定の画像を見せると特定の反応を示すという私たちの知識に基づいて、私たちのモデルが同じ処理能力を持つようにリバースエンジニアリングを試みた」とヤング氏は語った。

2018年、3人は、エッジを検出するために使用されたのと同じモデルが、ガンマリズムとして知られる視覚皮質のスパイク活動の全体的なパターンも再現できることを実証する2番目の論文を発表しました。 (ホタルが群れをなして発光しているのを観察したときに見られる光のパターンに似ています。)

現在、彼らの3番目の論文が審査のために提出されており、主に視覚皮質がコントラストの変化をどのように認識するかを説明しています。彼らの説明には、興奮性ニューロンが互いの活動を強化するメカニズムが関係しており、その効果はダンスパーティーで人々が互いにヒントを与え合い、協力して祝祭的な雰囲気を作り出す方法に似ていると示唆している。視覚皮質はまばらな入力データから完全な画像を作成できるため、このメカニズムは不可欠です。

ヤング、シャプレー、チャリカーは現在、視覚野が視野内で物体が移動する方向をどのように再構築するかを説明するために、方向感度メトリックをモデルに追加することに取り組んでいます。次に、視覚皮質が視覚刺激の時間的パターンをどのように認識するかを説明する予定です。たとえば、私たちは信号機の点滅をどのように認識するかを理解したいのですが、映画を観ているときに画像をフレームごとに理解することはできません。

後者の問題については、彼らは、視覚的印象の大まかな概要を脳に提示する役割を担う神経皮質の 6 つの層のうちの 1 つとして機能する単純なモデルを構築する予定です。現在の作業では、残りの 5 つのレイヤーはまだ考慮されていません。他のレイヤーは、さらに複雑な視覚要素の処理を担当しているからです。さらに、視覚皮質がどのように色を区別するかについても説明されていませんでした。実際、色を区別するメカニズムは私たちが想像するよりもはるかに複雑で、まったく異なる、より複雑な神経経路が関わっています。

彼らのモデルは視覚システム全体の謎を解明するにはまだ程遠いが、正しい方向への重要な一歩であり、生物学的に妥当な方法で視覚のメカニズムを解明しようとする最初のモデルである。

<<:  相関関係は因果関係ではない。ディープラーニングによりAIは「10万のなぜ」を問うことができる

>>:  PaddlePaddleがAIの旗印を掲げ、国産のディープラーニングフレームワークが人気

ブログ    

推薦する

将来、人工知能が自発的な感情知能を獲得することは可能でしょうか?

人工知能の発展は人類の生存を脅かすという見方は以前からあった。人類の知能の典型的な反映である囲碁で、...

人工知能、ブロックチェーン技術などが医療分野を改善している

ヘルスケア業界の成長は驚異的ですが、欠点がないわけではありません。医師や研究者は、一般的な病気や珍し...

.NET が提供する暗号化アルゴリズムの概要

データは、対称暗号化アルゴリズムまたは非対称暗号化アルゴリズムを使用して暗号化できます。対称暗号化は...

...

Nvidia、AIを使った仮想世界のリアルタイムレンダリングを実演

[[251560]] Nvidia は、従来のモデリングやグラフィック レンダリング エンジンではな...

ディープラーニングのためのテキスト前処理方法

[[432936]] [51CTO.com クイック翻訳]昨今、ディープラーニング、特に自然言語処理...

今日から彼は、黄仁訓院士です!米国工学アカデミーの2024年会員リストが発表され、清華大学の黄一東氏らが外国人会員に選出される

本日、2024年度の米国工学アカデミーの新会員リストが発表されました! Nvidiaの黄氏が選出され...

ガートナー:2025年にはベンチャーキャピタル投資の75%がAIを活用する

報道によると、権威ある調査機関ガートナーは本日発表したホワイトペーパーで、投資家による人工知能(AI...

大きな模型 = 容器に入った脳?同源病院の朱松春氏のチームがAGIの主な欠陥を分析

最近、ChatGPT/GPT-4シリーズの製品は世界的な注目と議論を集めており、それらに代表される大...

日本では想像以上にAIが活用されている

[[443157]]日本における人工知能の開発はますます成熟しつつあります。日本は現在、「人工知能ア...

マスターカードがAIを活用して詐欺を阻止し、誤ったチャージバックを削減する方法

【51CTO.com クイック翻訳】チェックアウト時に銀行カード取引が拒否されると、イライラしたり恥...

...

...

クラウドコンピューティングと人工知能が伝統的な医学を覆すのは時間の問題だ

2016年1月、国家衛生計画出産委員会は専門医向けの「5+3+x」標準化研修システムを発行しました。...

ニューラルネットワークと数学の関係は何ですか?読めば分かるよ

ニューラル ネットワークについて学んだことのある人なら誰でも、ニューラル ネットワークには非常に一般...