デアデビルが来た!バットセンスAIは、スマートフォンが音を聞いて3D画像を生成できるようにする

デアデビルが来た!バットセンスAIは、スマートフォンが音を聞いて3D画像を生成できるようにする

英国の科学者たちは、スマートフォンやノートパソコンなどの日常的な物に、デアデビルと同じくらい強力なコウモリのような環境認識機能を与える方法を発見した。

[[399341]]

グラスゴー大学のコンピューター科学者と物理学者が「Physical Review Letters」誌に発表した論文で概説されているこの研究は、セキュリティやヘルスケアの分野で応用できる可能性がある。

この技術の核となるのは、コウモリがエコーロケーションを使って移動したり狩りをしたりするのと同じように、反射エコーを使って画像を生成する高度な機械学習アルゴリズムです。

研究者らが提案したアルゴリズムは、スピーカーからのサウンドクリップや小型アンテナから送信された電波パルスが部屋を通過してセンサーに戻ってくるまでの時間を測定できる。

アルゴリズムは結果を巧みに分析することで、部屋の形、大きさ、レイアウトを推測し、存在する物体や人物を選び出すことができます。

結果はエコーデータを3次元画像に変換し、ビデオとして表示されます。

この研究とコウモリのエコーロケーションとの主な違いは、コウモリには方向を定めるのに役立つ 2 つの耳があるのに対し、アルゴリズムはマイクロフォンや無線アンテナなどの単一のポイントから収集されたデータで動作するように調整されている点です。

[[399342]]

「この技術は、マイクとスピーカー、あるいは無線アンテナを備えたあらゆるデバイスを通じて画像を生成するために使用できる可能性がある」と研究者らは述べた。

ターピン博士は、動物のエコーロケーションは驚くべき能力であり、科学はレーダーやライダーなど、反射したエコーから3D画像を生成するさまざまな方法でそれを再現することに成功したと述べた。

この研究は、以下の点で他のシステムとは異なります。

まず、3D 画像を作成するには、マイクまたはアンテナなどの単一の入力からのデータのみが必要です。

第二に、このアルゴリズムは、これら 2 つの機器のいずれかを備えたあらゆるデバイスをエコーロケーション デバイスに変換できます。

これは、このタイプの 3D イメージングのコストが大幅に削減され、多くの新しいアプリケーションが実現できることを意味します。

例えば、侵入者が反射した信号を拾うことで、カメラなしで建物を安全に守ることができます。

同じアプローチは、介護施設の虚弱患者の動きを追跡するためにも使用できます。

このシステムは、医療施設で患者の胸の上下動を追跡し、スタッフに呼吸の変化を警告するためにも使用できる。

論文では、研究者がノートパソコンのスピーカーとマイクを使ってキロヘルツ範囲の音波を生成および受信する方法を概説している。

彼らはまた、アンテナを使用してギガヘルツ範囲の無線周波数音についても同様の実験を行いました。

それぞれの試験で、研究者たちは、人が部屋の中を動き回ったときに反射する音波に関するデータを収集した。

同時に、研究者たちは、飛行時間と呼ばれるプロセスを使用して部屋の寸法を測定し、低解像度の画像を提供する特殊なカメラを使用して、部屋のデータも記録しました。

研究チームは、マイクからのエコーデータと飛行時間型カメラの画像データを組み合わせて、エコーの特定の遅延を画像と関連付けるために、機械学習アルゴリズムを何百回も繰り返してトレーニングしました。

最終的に、アルゴリズムはエコーデータのみから部屋とその内容物の非常に正確な画像を生成することを学習し、コウモリのような周囲を感知する能力を獲得しました。

この研究は、単一ピクセル検出器を使用して閃光の反射を測定することで3D画像を作成するニューラルネットワークアルゴリズムを訓練した英国チームによる以前の研究に基づいています。

ターピン博士は次のように付け加えた。「光と音を使ったこのアルゴリズム機械学習技術の有効性を実証できたことは、非常に喜ばしいことです。世界を新しい方法で認識する大きな可能性があることは明らかであり、今後さらに高解像度の画像を生成する可能性を探求し続けたいと考えています。」

<<:  BI と AI が出会うとき、「最強の脳」がどのように意思決定を支援するのかを見てみましょう。

>>:  ガートナーの最新のマジック・クアドラントレポートでは、IBMがエンタープライズAIテクノロジーのグローバルリーダーであると示されています。

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

1 つの記事で NLP 実装の難しさを理解する

[51CTO.comからのオリジナル記事] 近年、自然言語処理技術は徐々に最も広く使用されている人工...

...

...

Scikit-Learn を使用して、MNIST データセットを分類するための K 近傍法アルゴリズムを構築する

K 最近傍アルゴリズム、K-NN とも呼ばれます。今日のディープラーニングの時代では、この古典的な機...

...

...

...

AIが認知症患者の自立した生活にどのように役立つか

[[279905]]写真はインターネットから照明や音楽を Alexa や Siri などの音声制御テ...

賢くなる方法: 神経科学にヒントを得た人工知能

[[201067]]私はデイビッド・マーが「神経科学のチューリング」のような存在だといつも感じていま...

コンピューティングパワーとは正確には何でしょうか?

ご存知のとおり、コンピューティング パワーの文字通りの意味はコンピューティング能力です。 「コンピュ...

...

教師あり学習の一般的なアルゴリズムは何ですか?どのように適用されますか?

教師あり学習とは何ですか?教師あり学習は機械学習のサブセットであり、機械学習モデルの入力データにラベ...

分散トレーニング入門: PyTorch を使用してマルチ GPU 分散トレーニングを実装する方法

具体的には、この記事ではまず、分散コンピューティングの基本概念と、分散コンピューティングがディープラ...

...

大企業面接のための iAsk の「スケジュール アルゴリズム」、写真 20 枚が当たる

[[341122]]この記事はWeChatの公開アカウント「Xiao Lin Coding」から転載...