ビデオ映像から間取り図を推測する新たなAI研究は目を見張るものがある

ビデオ映像から間取り図を推測する新たなAI研究は目を見張るものがある

フロアプランは、空間を視覚化したり、ルートを計画したり、建物のデザインを伝えたりするのに役立ちます。たとえば、新しい建物に入るロボットは、フロアプランを使用して全体的なレイアウトをすばやく認識できます。通常、フロアプランを作成するには、3D センサーとカメラが空間全体をキャプチャできるように、完全なレイアウトが必要です。

1月11日、海外メディアの報道によると、フェイスブック、テキサス大学オースティン校、カーネギーメロン大学の研究者らが、視覚と音声を利用して短いビデオクリップから間取り図を再構築する人工知能技術を研究している。

[[375129]]

研究者らは、音声は画像のマッピング機能を補完する空間的および意味的な信号を提供すると主張している。これは、音が本質的に物体の形状によって駆動されるためだと彼らは言います。音が表面で反射し、カメラの視野をはるかに超えた部屋の形状が明らかになります。遠くから、たとえ数部屋離れた場所からでも聞こえる音は、音響物体が存在する可能性のある自由空間の存在を明らかにすることができます。さらに、さまざまな方向から聞こえる音は、その音が表す活動や物に基づいてレイアウトを明らかにします。たとえば、シャワーの音はバスルームの方向を示唆し、電子レンジの音はキッチンの方向を示唆する場合があります。

AV-Mapと呼ばれる研究者の手法は、マルチチャンネルオーディオ付きの短いビデオを2Dフロアプランに変換するように設計されています。機械学習モデルは、オーディオとビジュアルのデータシーケンスを利用してフロアプランの構造とセマンティクスを推測し、最後にデコードコンポーネントを使用してオーディオとビデオの情報を融合します。 AV-Map は、ビデオで直接見える領域を大幅に超えるフロア プランを生成し、空きスペースと占有エリアをファミリー ルームやキッチンなどの個別の意味的な部屋ラベルに分割して表示します。

チームは、Matternet3D および SoundSpaces データセットから抽出したデジタル環境で、アクティブとパッシブの 2 つのセットアップを試しました。最初の実験では、仮想カメラを使用して、模型の家の部屋を移動しながら既知の音を再生しました。 2 番目のケースでは、家の中の物や人が出す自然な音だけに頼ります。

研究者らは、今後の研究では複数階のフロアプランを拡張し、マッピングのアイデアをカメラを積極的に制御するロボットに結び付けることを検討する予定だと述べている。

<<:  AI教育改革の障害

>>:  気候変動と闘うためのAIの8つのガイドライン

ブログ    
ブログ    

推薦する

Jia Jiayaのチームが世界初の70B長文大規模言語モデルをオープンソース化し、ProMaxを使って論文や小説を直接読めるようにした。

皆さん、大規模言語モデル(LLM)の長年の課題がついに解決されました!つい最近、香港中文大学とMIT...

IoTとAI: この強力な組み合わせの5つの興味深い応用

人工知能は現代世界のあらゆる分野を征服しつつあります。しかし、それらはすべて私たちにとって良いことな...

強化学習の父がAGIスタートアップ業界に参入!伝説のプログラマー、カーマックと力を合わせ、彼らは大規模なモデルに頼らないことを誓った

伝説のプログラマー、ジョン・カーマックと強化学習の父、リチャード・サットンが力を合わせ、 All i...

...

すべてのAI公開コースが無料でご利用いただけます! 14 のカテゴリ、230 のコース、6,000 以上の GitHub スター

十分に読書をして直感を養い、直感を信じて挑戦してみましょう。たくさんの読書を通して直感を養い、自分の...

アマゾン ウェブ サービスが中国で新たな機械学習サービスを開始

[51CTO.com からのオリジナル記事]現在、ますます多くの企業が機械学習や人工知能に多額の資金...

いくつかの典型的なアルゴリズム面接の質問に対する Java ソリューション

質問1:公共クラスtestClockwiseOutput { //行列を時計回りに印刷する @テスト...

ハイエンドチップはインテリジェント運転の問題を解決できるでしょうか?

この数か月の「影響」を経て、誰もが半導体不足の事実を十分に認識したと思います。2020年12月以来、...

機械学習モデルは展開するには大きすぎますか? 3つの解決策をご紹介します

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

AI が大学入試のエッセイのテーマを予測: 科学、形而上学、それとも誇大広告?

大学受験生にとって、出題される問題を全て知っていて、分からない問題の答えを暗記していることが一番幸せ...

...

仕事の脅威? AIはマーケティング担当者の仕事を奪うのでしょうか?

先週、コピーライターのパネルがAIによってコピーライターの必要性がなくなるかどうかを議論した。一部の...

人工知能の簡単な歴史 | (1)相農は人工知能の誕生を目撃した

[[391106]] 1956年、人工知能元年。その夏、米国ニューハンプシャー州ハノーバーの小さな町...