デアデビルが来た!バットセンスAIは、スマートフォンが音を聞いて3D画像を生成できるようにする

デアデビルが来た!バットセンスAIは、スマートフォンが音を聞いて3D画像を生成できるようにする

英国の科学者たちは、スマートフォンやノートパソコンなどの日常的な物に、デアデビルと同じくらい強力なコウモリのような環境認識機能を与える方法を発見した。

[[399341]]

グラスゴー大学のコンピューター科学者と物理学者が「Physical Review Letters」誌に発表した論文で概説されているこの研究は、セキュリティやヘルスケアの分野で応用できる可能性がある。

この技術の核となるのは、コウモリがエコーロケーションを使って移動したり狩りをしたりするのと同じように、反射エコーを使って画像を生成する高度な機械学習アルゴリズムです。

研究者らが提案したアルゴリズムは、スピーカーからのサウンドクリップや小型アンテナから送信された電波パルスが部屋を通過してセンサーに戻ってくるまでの時間を測定できる。

アルゴリズムは結果を巧みに分析することで、部屋の形、大きさ、レイアウトを推測し、存在する物体や人物を選び出すことができます。

結果はエコーデータを3次元画像に変換し、ビデオとして表示されます。

この研究とコウモリのエコーロケーションとの主な違いは、コウモリには方向を定めるのに役立つ 2 つの耳があるのに対し、アルゴリズムはマイクロフォンや無線アンテナなどの単一のポイントから収集されたデータで動作するように調整されている点です。

[[399342]]

「この技術は、マイクとスピーカー、あるいは無線アンテナを備えたあらゆるデバイスを通じて画像を生成するために使用できる可能性がある」と研究者らは述べた。

ターピン博士は、動物のエコーロケーションは驚くべき能力であり、科学はレーダーやライダーなど、反射したエコーから3D画像を生成するさまざまな方法でそれを再現することに成功したと述べた。

この研究は、以下の点で他のシステムとは異なります。

まず、3D 画像を作成するには、マイクまたはアンテナなどの単一の入力からのデータのみが必要です。

第二に、このアルゴリズムは、これら 2 つの機器のいずれかを備えたあらゆるデバイスをエコーロケーション デバイスに変換できます。

これは、このタイプの 3D イメージングのコストが大幅に削減され、多くの新しいアプリケーションが実現できることを意味します。

例えば、侵入者が反射した信号を拾うことで、カメラなしで建物を安全に守ることができます。

同じアプローチは、介護施設の虚弱患者の動きを追跡するためにも使用できます。

このシステムは、医療施設で患者の胸の上下動を追跡し、スタッフに呼吸の変化を警告するためにも使用できる。

論文では、研究者がノートパソコンのスピーカーとマイクを使ってキロヘルツ範囲の音波を生成および受信する方法を概説している。

彼らはまた、アンテナを使用してギガヘルツ範囲の無線周波数音についても同様の実験を行いました。

それぞれの試験で、研究者たちは、人が部屋の中を動き回ったときに反射する音波に関するデータを収集した。

同時に、研究者たちは、飛行時間と呼ばれるプロセスを使用して部屋の寸法を測定し、低解像度の画像を提供する特殊なカメラを使用して、部屋のデータも記録しました。

研究チームは、マイクからのエコーデータと飛行時間型カメラの画像データを組み合わせて、エコーの特定の遅延を画像と関連付けるために、機械学習アルゴリズムを何百回も繰り返してトレーニングしました。

最終的に、アルゴリズムはエコーデータのみから部屋とその内容物の非常に正確な画像を生成することを学習し、コウモリのような周囲を感知する能力を獲得しました。

この研究は、単一ピクセル検出器を使用して閃光の反射を測定することで3D画像を作成するニューラルネットワークアルゴリズムを訓練した英国チームによる以前の研究に基づいています。

ターピン博士は次のように付け加えた。「光と音を使ったこのアルゴリズム機械学習技術の有効性を実証できたことは、非常に喜ばしいことです。世界を新しい方法で認識する大きな可能性があることは明らかであり、今後さらに高解像度の画像を生成する可能性を探求し続けたいと考えています。」

<<:  BI と AI が出会うとき、「最強の脳」がどのように意思決定を支援するのかを見てみましょう。

>>:  ガートナーの最新のマジック・クアドラントレポートでは、IBMがエンタープライズAIテクノロジーのグローバルリーダーであると示されています。

ブログ    

推薦する

...

WatsonAIOps - AIの力を活用して、IT運用の効率とセキュリティの持続可能性を次のレベルに引き上げます

情報技術 (IT) 運用管理は、ミッションクリティカルなビジネス アプリケーションをサポートするため...

...

機械学習モデルの仕組み

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

人工知能はデータを「食べる」

機械学習 (ML) プロジェクトに取り組んだことがある人なら、機械学習ではアルゴリズムをトレーニング...

...

紙画像の不正使用? AI: この道は私が塞いでいる

[[441681]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

プログラマーが使用する基本アルゴリズムトップ10

[[188736]]アルゴリズム1: クイックソートアルゴリズムクイックソートは、Tony Hal...

...

ロボットはペンを回したりクルミを転がしたりすることを学びました。 GPT-4では、タスクが複雑になるほどパフォーマンスが向上します

ビッグデータダイジェスト制作親愛なる友人たち、人工知能(AI)がチェス、囲碁、Dotaを征服した後、...