デアデビルが来た！バットセンスAIは、スマートフォンが音を聞いて3D画像を生成できるようにする

英国の科学者たちは、スマートフォンやノートパソコンなどの日常的な物に、デアデビルと同じくらい強力なコウモリのような環境認識機能を与える方法を発見した。

[[399341]]

グラスゴー大学のコンピューター科学者と物理学者が「Physical Review Letters」誌に発表した論文で概説されているこの研究は、セキュリティやヘルスケアの分野で応用できる可能性がある。

この技術の核となるのは、コウモリがエコーロケーションを使って移動したり狩りをしたりするのと同じように、反射エコーを使って画像を生成する高度な機械学習アルゴリズムです。

研究者らが提案したアルゴリズムは、スピーカーからのサウンドクリップや小型アンテナから送信された電波パルスが部屋を通過してセンサーに戻ってくるまでの時間を測定できる。

アルゴリズムは結果を巧みに分析することで、部屋の形、大きさ、レイアウトを推測し、存在する物体や人物を選び出すことができます。

結果はエコーデータを3次元画像に変換し、ビデオとして表示されます。

この研究とコウモリのエコーロケーションとの主な違いは、コウモリには方向を定めるのに役立つ 2 つの耳があるのに対し、アルゴリズムはマイクロフォンや無線アンテナなどの単一のポイントから収集されたデータで動作するように調整されている点です。

「この技術は、マイクとスピーカー、あるいは無線アンテナを備えたあらゆるデバイスを通じて画像を生成するために使用できる可能性がある」と研究者らは述べた。

ターピン博士は、動物のエコーロケーションは驚くべき能力であり、科学はレーダーやライダーなど、反射したエコーから3D画像を生成するさまざまな方法でそれを再現することに成功したと述べた。

この研究は、以下の点で他のシステムとは異なります。

まず、3D 画像を作成するには、マイクまたはアンテナなどの単一の入力からのデータのみが必要です。

第二に、このアルゴリズムは、これら 2 つの機器のいずれかを備えたあらゆるデバイスをエコーロケーションデバイスに変換できます。

これは、このタイプの 3D イメージングのコストが大幅に削減され、多くの新しいアプリケーションが実現できることを意味します。

例えば、侵入者が反射した信号を拾うことで、カメラなしで建物を安全に守ることができます。

同じアプローチは、介護施設の虚弱患者の動きを追跡するためにも使用できます。

このシステムは、医療施設で患者の胸の上下動を追跡し、スタッフに呼吸の変化を警告するためにも使用できる。

論文では、研究者がノートパソコンのスピーカーとマイクを使ってキロヘルツ範囲の音波を生成および受信する方法を概説している。

彼らはまた、アンテナを使用してギガヘルツ範囲の無線周波数音についても同様の実験を行いました。

それぞれの試験で、研究者たちは、人が部屋の中を動き回ったときに反射する音波に関するデータを収集した。

同時に、研究者たちは、飛行時間と呼ばれるプロセスを使用して部屋の寸法を測定し、低解像度の画像を提供する特殊なカメラを使用して、部屋のデータも記録しました。

研究チームは、マイクからのエコーデータと飛行時間型カメラの画像データを組み合わせて、エコーの特定の遅延を画像と関連付けるために、機械学習アルゴリズムを何百回も繰り返してトレーニングしました。

最終的に、アルゴリズムはエコーデータのみから部屋とその内容物の非常に正確な画像を生成することを学習し、コウモリのような周囲を感知する能力を獲得しました。

この研究は、単一ピクセル検出器を使用して閃光の反射を測定することで3D画像を作成するニューラルネットワークアルゴリズムを訓練した英国チームによる以前の研究に基づいています。

ターピン博士は次のように付け加えた。「光と音を使ったこのアルゴリズム機械学習技術の有効性を実証できたことは、非常に喜ばしいことです。世界を新しい方法で認識する大きな可能性があることは明らかであり、今後さらに高解像度の画像を生成する可能性を探求し続けたいと考えています。」

<<: BI と AI が出会うとき、「最強の脳」がどのように意思決定を支援するのかを見てみましょう。

DeepMind の最新研究: AI が人間に勝ち、より優れた経済メカニズムを設計 | Nature サブジャーナル

デアデビルが来た！バットセンスAIは、スマートフォンが音を聞いて3D画像を生成できるようにする

DeepMind の最新研究: AI が人間に勝ち、より優れた経済メカニズムを設計 | Nature サブジャーナル

日本のメディアは、監視と保護に加えて感染症の予防にも役立つ鳥類識別AIの中国での推進に注目している。

自動車業界における 5G の登場は、車両のインターネットと自動運転の普及にどのように役立つのでしょうか?

Google Brain、ロボットアームの把持速度を2倍にする並行RLアルゴリズムを提案

データセンターの機械学習が運用を最適化する方法

「顔認証」は大人気だけど、知らないことも多い

企業の4分の1以上が従業員による生成AIの使用を禁止している

人工知能が美女を元の姿に戻す方法

LK-99「早納品、遅案内」？インドの科学者は、新しいメロンを生産するために原作者から指導を受ける：新しいサンプルは量子ロックと良好な伝導性を示す

推薦する

SQL SERVER データマイニング: クラスタリングアルゴリズムとシーケンシャルクラスタリングアルゴリズムの理解

なぜ人工知能はテクノロジーの未来なのか?

臨床研究における人工知能と機械学習の活用の機会をいかに捉えるか

機械学習における小規模データの重要性

学生の未来を照らすSquirrel AIは、すべての子供にAIスーパー教師を授けます

GPT-4 は P≠NP であると結論付け、Terence Tao の予測は実現しました。世界の数学の問題を解く「ソクラテス的推論」対話97ラウンド

ビジネスリーダーが AI プロジェクトの失敗を回避する 3 つの方法

今後 5 年間で AI はさまざまな分野をどのように変えるのでしょうか? LLM から AI タンパク質設計、ヘルスケアまで...

国家教科書委員会：ブロックチェーン、AIなどの分野を中心に新しい教科書が多数編纂されます！