人間の目に匹敵する視覚:この画期的な光学センサーは人間の網膜を模倣し、AIに大きな進歩をもたらすことが期待されています。

人間の目に匹敵する視覚:この画期的な光学センサーは人間の網膜を模倣し、AIに大きな進歩をもたらすことが期待されています。

視覚、聴覚、嗅覚、味覚、触覚は、人間の最も基本的な五感です。その中でも、視覚は極めて重要です。結局のところ、種が進化するにつれて、人間の最も繊細で複雑な器官である目は、比類のない知覚能力を持っています。

神経科学と認知心理学の研究によると、外部情報の80%以上は視覚を通じて脳に入り込むことが分かっています。

世代から世代へと技術革新が進むにつれ、人間の目を模倣しようとする試みが次々と生まれています。

2015年、米国ミネソタ州に住むアレン・ズデラドという68歳の男性が、10年間の失明の後、「バイオニックアイ」によって視力を取り戻した。

2020年5月、香港科技大学のファン・チヨン氏のチームは、米国のカリフォルニア大学バークレー校およびローレンス・バークレー国立研究所の研究者グループと共同で、網膜の問題に対する最新の解決策を提案し、さらには人間の目を上回る複数の性能を備えたバイオニックアイを開発した。

[[357284]]

つい最近、米国の公立研究大学であるオレゴン州立大学は、光学センサーの分野で大きな進歩を遂げました。視野の変化を感知する人間の目の能力にさらに近いセンサーがついに登場したのです。

オレゴン州立大学は次のように述べた。

  • このセンサーは、画像認識、ロボット工学、人工知能の分野における大きな進歩です。人間の目のような画期的な光学センサーは、人工知能の発展における重要な一歩です。

新しい網膜センサーの構築

2020年12月8日、関連する研究成果が「ペロブスカイト網膜型センサー」と題してJournal of Applied Physics Expressに正式に掲載されました。論文の著者は、オレゴン州立大学工学部の研究員で電気・コンピュータ工学科助教授のジョン・ラブラム氏と大学院生のシンシア・トルヒージョ・ヘレラ氏です。


  • 最先端のスーパーコンピュータでさえ、人間の脳の複雑さに匹敵することはできません。

当初、この事実に基づいて、ニューロモルフィック コンピューティングの分野での研究が始まりました。その設計は、機械学習タスクを実行する際に従来のコンピューターを上回る性能を発揮することを目指しています。その原理は、一言でまとめると、人間の脳 (の一部) をハードウェアにコピーするということです。

この論文では、近年この分野で大きな進歩があったにもかかわらず、ニューロモルフィック プロセッサに提供されるほぼすべての入力信号が依然として従来のフォン ノイマン コンピュータ アーキテクチャ向けに設計されていることを紹介しています。

研究チームは、単純な光感応コンデンサを設計し、光刺激に対する反応を特徴づけました。

下の図 a に示すように、構造は二重層誘電体に基づいています。

  • 底部の二酸化ケイ素: 二酸化ケイ素は絶縁性が高く、基本的に光に反応しません。
  • 一番上にあるのはペロブスカイト、メチルアンモニウムヨウ化鉛 (MAPbI3) です。これは、光伝導応答が大きく、光を当てると誘電率が大きく変化する化合物で、光を当てると静電容量を変えることができる誘電体の理想的な候補となります。

電極:

  • 下部電極は高濃度にドープされたシリコンで、基板として機能します。
  • 上部電極は熱蒸着によって堆積された 15nm の金で、接触抵抗が高くても電気を伝導しながら光に対して半透明になるほど十分に薄くなるように設計されています。

ジョン・ラブラム氏はこう語った。

  • これまで、人間の目を模倣したデバイス(網膜視覚センサー)を作成する試みは、ソフトウェアまたはより複雑なハードウェアに依存していました。しかし、私たちが設計したこの新しいセンサーの動作には、基本設計にペロブスカイト半導体の極薄層が組み込まれています。ペロブスカイトは光にさらされると、強力な電気絶縁体から導体に変化します。太陽エネルギーを開発する可能性を秘めており、近年、学術界でもペロブスカイトに関する広範な研究が行われています。

上記の構造に基づいて、外部抵抗器と直列に接続すると、コンデンサが充電/放電されるときに抵抗器の両端の電圧降下(電位差とも呼ばれます)が一時的に急上昇し、その後平衡値に戻ります。つまり、照度が変化するとセンサーにスパイクが発生し、それ以外のときはゼロ電圧が出力されます (上の図 d を参照)。

研究チームが設計した感光性コンデンサは、設計と使用目的の両方において他の科学チームによって開発された従来のフォトコンデンサとは異なります。フォトコンデンサは太陽放射からのエネルギーを蓄えるように設計されているのに対し、上記のセンサーはニューロモルフィック コンピューティング用の光刺激の変化を検出するように設計されています。

人間の目の知覚を模倣することでよりリアルになる

では、上記のセンサーは実際に人間の目をどの程度模倣しているのでしょうか?

まず、研究者たちは、センサーに適用される光刺激としてビデオを再生することにより、大規模なアレイをシミュレートしました。

結果は次のことを示しています:

  • ビデオの静止部分に対応して、センサーはより暗いビデオを出力します。
  • センサーは、ビデオの動きのある部分に応じて明るいビデオを出力します。
  • 光がない状態でゆっくりと移動すると、センサー出力の明るい領域に「ゴースト」効果が発生します。

センサーが動画像に対して非常に明白な反応を示すことがわかります。

研究者らはその後、別のテストとして、特定の角度で配置された光刺激をセンサーに適用した。

この実験は、1950年代と1960年代に科学者が猫の特定のニューロンが特定の角度で配置された光刺激に強く反応することに気づいたという発見に触発されたものである。科学者たちは、網膜内の一部の細胞の特定の配置が光刺激に反応して過分極と脱分極を引き起こすと考えています。

そのため、研究者たちは、コンデンサ (C センサー) の電圧降下と抵抗器 (R センサー) の電圧降下という 2 つの値を測定することを選択しました。


結果は上の図に示されています。このセンサーは、特定の方向の刺激に対してより強く反応します。

上記の 2 つの実験は、このセンサーが人間の目の知覚を模倣する能力が確かに強力であることを示しています。

それだけでなく、研究者たちは、これはセンサーなので複雑な読み出しアルゴリズムや後処理を必要とせず、センサーが向けられている物体の方向に応じて電圧を直接出力できると考えています。

ジョン・ラブラム氏はこう語った。

  • 新しいセンサーはニューロモルフィック・コンピューターと完璧に連携し、自動運転車、ロボット工学、高度な画像認識などの次世代の人工知能アプリケーションを強化することになります。

<<:  安全で制御可能、かつ法的に準拠した人工知能は金融分野で「原則化」されている

>>:  IoT セキュリティ: RSA 暗号化および復号化アルゴリズム

ブログ    
ブログ    

推薦する

GitHub トップ プロジェクト: 30 万語の図解アルゴリズム問題辞書、超実用的なリソース、6,000 個のスター

[[336071]]貴重なリソースをまとめましたので、ぜひご覧ください。アルゴリズムはコンピュータサ...

テスラの自動操縦装置が別の人をはねて死亡させ、被害者の家族が訴訟を起こす

電気自動車メーカー、テスラの自動操縦機能に関連する死亡事故がまた発生した。被害者は高速道路脇でモデル...

15歳の少女が農場の収穫機にヒントを得てピンポン球を拾うロボットを発明

最近、上海の15歳の中学生が卓球ボールを拾うロボットを発明した。体育館の床に散らばった卓球ボールを自...

このアルゴリズムチームは 2020 年に何をしましたか?

[[383980]]冒頭に書いた私自身、毎年まとめを書く習慣があります。2020年は、私の職務が垂...

6種類の負荷分散アルゴリズムの概要

C言語を学んだ友人やIT関係の人ならアルゴリズムには詳しいと思います。したがって、分野が異なれば、ア...

顔認識で間違った人物が「捕まった」ため、その人物は10日間刑務所に収監された

それはとんでもないことだ。何もしてないのに理由もなく10日間警察に拘留されるんですか? ! [[39...

NetEase Games AIOps実践:異常検知の最適化戦略とプラットフォーム構築

この共有では主に以下の点が紹介されます。 AIOps ロードマップ異常検出プラットフォーム構築インテ...

APP はユーザーのプライバシーと顔認識生体認証情報を深く掘り下げ、「データ疫病」の到来に注意

315 Gala で摘発された企業は、業界内ではほんの少数派です。ユーザーのプライバシーを侵害するア...

通信会社は AI と機械学習をどのように活用して利益率を向上させることができるでしょうか?

過去 10 年間で世界中のスマートフォン ユーザーの数は急増しており、今後も同様の増加傾向が続くと思...

...

AIがスマートフォンを制御するようになると、アプリ時代の終焉が近づいているかもしれない

Mobile World Congress 2024 で AI について言及しないわけにはいきません...

...

Google の社内機械学習プロジェクト「Project Ninja」の秘密を解明します。

すべての製品に人工知能を統合したい場合は、強力な機械学習チームを育成する必要があります。 Googl...

Transformerが3Dモデリングに革命を起こし、MeshGPT生成結果がプロのモデラーやネットユーザーに衝撃を与える:革命的なアイデア

コンピュータグラフィックスでは、「三角メッシュ」は 3D 幾何学的オブジェクトの主な表現であり、ゲー...

AGI を理解する: 知能の未来?

病気の診断から交響曲の作曲、車の運転から道徳的な判断に至るまで、人間が行えるあらゆる作業を機械が実行...