夜もカラフルに、ディープラーニングでフルカラー暗視システムを実現

夜もカラフルに、ディープラーニングでフルカラー暗視システムを実現

いくつかの軍事大作映画では、兵士が暗視ゴーグルを装着して前方を捜索するシーンは欠かせないようです。暗闇で赤外線を使って見る暗視システムは、通常、見たものをモノクロ画像としてレンダリングします。

画像出典: flir.com

しかし、最近の研究では、カリフォルニア大学アーバイン校の科学者がディープラーニングAI技術を使用して、赤外線視覚によって光のない状況でも目に見える色を認識できる新しい方法を設計しました。

「世界中の多くの場所では、信号機のように、人々が判断を下す際に頼りにするような方法で色分けされている」と、カリフォルニア大学アーバイン校のエンジニア、外科医、視覚科学者で、この研究の共同筆頭著者であるアンドリュー・ブラウン氏は述べた。

暗視システムは特別なケースです。夜間を照らすために赤外線を使用する暗視システムは、通常、シーンを緑色のみでレンダリングし、通常の光の中で見える色を表示できません。新しい暗視システムの中には、超高感度カメラを使用して可視光を増幅するものもありますが、これらのカメラは増幅する光がない真​​っ暗な環境ではほとんど色を表示できません。

アンドリュー・ブラウン

そこで研究者らは、この研究で物体に可視光を与える染料や顔料はそれぞれ、可視波長のセットだけでなく、赤外線波長のセットも反射する可能性が高いと推論した。したがって、暗視システムを各染料と顔料の赤外線指紋を認識するようにトレーニングできれば、各染料と顔料に関連付けられた可視光を使用して画像を表示できるようになります。

レンダリング

現在、関連論文がPLOS ONE誌に掲載されています。

論文アドレス: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0265185

この研究は、人間には知覚できない近赤外線照明から人間の可視スペクトル内のシーンを予測するための第一歩です。今後の研究により、暗視システムや可視光に敏感な生物学的サンプルの研究など、さまざまな用途が大きく進歩する可能性があります。

研究概要

人間は400〜700nmの可視スペクトルの光を知覚できます。一部の暗視システムでは、人間には知覚できない赤外線を使用して画像をデジタル ディスプレイにレンダリングし、可視スペクトルでモノクロ画像を表示します。

研究者たちは、人間が可視スペクトル光を使用して知覚するのと同じように、シーン内の赤外線スペクトル照明を使用してそのシーンの可視スペクトルレンダリングを予測できる、最適化されたディープラーニングアーキテクチャによって駆動されるイメージングアルゴリズムを開発したいと考えました。人間は完全な「暗闇」の中にいて、赤外線のみで照らされているとき、可視スペクトルのシーンをデジタルでレンダリングすることができます。

画像処理対象。赤外線照明のみを使用して表示された画像と、ディープラーニングを使用して NIR データを処理した後の可視スペクトルの画像を比較したものです。

「モノクロカメラは、撮影しているシーンから反射されるあらゆる光子に敏感です」とブラウン氏は言う。「そこで、調整可能な光源を使ってシーンに光を当て、モノクロカメラを使って、さまざまな照明色の下でそのシーンから反射される光子を捉えます。」

この目的のために、研究者らは可視光と近赤外光に敏感なモノクロカメラを使用して、標準的な可視光の赤(604nm)、緑(529nm)、青(447nm)光と赤外波長(718、777、807nm)をカバーするマルチスペクトル照明下での顔の指紋画像の画像データセットを収集しました。次に、研究者らは、U-Net のようなアーキテクチャを持つ畳み込みニューラル ネットワークを最適化し、近赤外線画像のみから可視スペクトル画像を予測できるようにしました。

フェイスポートレートライブラリのサンプル画像

研究者たちはその後、3枚の赤外線画像とカラー画像を組み合わせて、シーン内の色を予測する人工知能ニューラルネットワークを訓練した。ニューラル ネットワークはトレーニングとパフォーマンスの向上を経て、3 枚の赤外線画像から実際の物体に非常に近いカラー画像を再構築できるようになりました。下の左側の写真は可視スペクトルを使用した実際の色を示しており、右側の写真はディープラーニング アルゴリズムによって有効になった色を示しています。

「赤外線チャンネルや赤外線カラーの数を増やすと、より多くのデータが得られ、実際の画像に非常に近い画像がどのように見えるかを予測する精度が向上します」とブラウン氏は言う。「この研究で提案した方法は、人間の目では見えない3つの異なる赤外線カラーの画像を取得するために使用できます。」

しかし、研究者たちはそのアルゴリズムと技術を印刷されたカラー写真でのみテストした。彼らは、これらのアルゴリズムと技術をビデオ、そして最終的には現実世界の物体や人間の対象に適用することを目指しています。

参考リンク:

  • https://spectrum.ieee.org/night-vision-infrared
  • https://www.popsci.com/technology/ai-infrared-night-vision-in-color/

<<:  人工知能が野生生物保護活動に貢献

>>:  製造業における機械学習

ブログ    
ブログ    
ブログ    

推薦する

世界初!人間の脳のようなスーパーコンピュータ「シェナン」がまもなく発売され、ムーアの法則を破り、エネルギー消費を数桁削減する

人間の脳は地球上で最も効率的な計算装置です。わずか 20W の電力と 1.3kg の質量で、1 秒間...

古典的な構造から改良された方法まで、ニューラルネットワーク言語モデルのレビュー

自然言語処理 (NLP) システムのコアコンポーネントとして、言語モデルは単語表現と単語シーケンスの...

月給5万ドルでこのホットなAI分野をマスターするには、これらの9冊の本を読むだけで十分です

はじめに:国内の求人検索サイトのデータによると、2019年現在、上海の自然言語処理(NLP)関連職種...

AIが史上初の小説を創った。読んでびっくりしました。

[[248937]] AI が書いた初の小説が登場。予想通り奇妙な内容小説家ロス・グッドウィンは、...

...

失礼ながら、モデルはプロンプトが何を言っているのか理解できない可能性があります。

GPT-3などの超大規模モデルの登場により、コンテキスト内学習も普及してきました。インコンテキスト...

...

AIが労働力に及ぼす可能性のある3つの影響

「GenAIは、農業革命と産業革命以来、最も重要な変革となるかもしれません。」まあ、心配しないでくだ...

SQL は ChatGPT を実行できますか?答えはYESです!

ChatGPTは世界中で人気を博しています。今日の質問は、SQL で ChatGPT を実行できる...

回答 2024: 生成 AI は「スーパー アプリ」になるか?

ゲスト: 陳斌、黄文馨ホスト | ユン・チャオノア著制作:51CTO テクノロジースタック(WeCh...

人工知能技術がホームセキュリティ市場の急速な発展を促進

[[240109]]ホームセキュリティ市場はAIを活用してどのように安全を確保しているのか家庭のセキ...

「地表」から「宇宙」まで、探査ロボットが未知の領域の秘密を解き明かす

ロボットは現代社会で生み出された新しい種です。科学技術の進歩により、ロボットの開発はもはや人間の能力...

Google が 11 の言語をカバーする TyDi QA コーパスをリリース

[[315942]]多言語の質問応答技術の研究を促進するために、Google は 11 種類の言語を...

DALL·E 3のベンチマーク!メタ最強の文豪エミュの技術レポートを公開

数日前、OpenAIはDALL·E 3をリリースしたばかりで、ビジュアルイメージは再び新たな段階に上...

...