フロアプランは、空間を視覚化したり、ルートを計画したり、建物のデザインを伝えたりするのに役立ちます。たとえば、新しい建物に入るロボットは、フロアプランを使用して全体的なレイアウトをすばやく認識できます。通常、フロアプランを作成するには、3D センサーとカメラが空間全体をキャプチャできるように、完全なレイアウトが必要です。 1月11日、海外メディアの報道によると、フェイスブック、テキサス大学オースティン校、カーネギーメロン大学の研究者らが、視覚と音声を利用して短いビデオクリップから間取り図を再構築する人工知能技術を研究している。 研究者らは、音声は画像のマッピング機能を補完する空間的および意味的な信号を提供すると主張している。これは、音が本質的に物体の形状によって駆動されるためだと彼らは言います。音が表面で反射し、カメラの視野をはるかに超えた部屋の形状が明らかになります。遠くから、たとえ数部屋離れた場所からでも聞こえる音は、音響物体が存在する可能性のある自由空間の存在を明らかにすることができます。さらに、さまざまな方向から聞こえる音は、その音が表す活動や物に基づいてレイアウトを明らかにします。たとえば、シャワーの音はバスルームの方向を示唆し、電子レンジの音はキッチンの方向を示唆する場合があります。 AV-Mapと呼ばれる研究者の手法は、マルチチャンネルオーディオ付きの短いビデオを2Dフロアプランに変換するように設計されています。機械学習モデルは、オーディオとビジュアルのデータシーケンスを利用してフロアプランの構造とセマンティクスを推測し、最後にデコードコンポーネントを使用してオーディオとビデオの情報を融合します。 AV-Map は、ビデオで直接見える領域を大幅に超えるフロア プランを生成し、空きスペースと占有エリアをファミリー ルームやキッチンなどの個別の意味的な部屋ラベルに分割して表示します。 チームは、Matternet3D および SoundSpaces データセットから抽出したデジタル環境で、アクティブとパッシブの 2 つのセットアップを試しました。最初の実験では、仮想カメラを使用して、模型の家の部屋を移動しながら既知の音を再生しました。 2 番目のケースでは、家の中の物や人が出す自然な音だけに頼ります。 研究者らは、今後の研究では複数階のフロアプランを拡張し、マッピングのアイデアをカメラを積極的に制御するロボットに結び付けることを検討する予定だと述べている。 |
スマート医療産業の急速な発展は、多くの患者に恩恵をもたらしています。伝統的な医療業界をアップグレード...
Googleは10月13日、今週の木曜日からGoogleの「Search Generative E...
AI ツールが合法化され、職場に導入されるようになると、人々は当然、その使用例や AI ツールに依存...
私たちは前例のない危機を生きています。 COVID-19パンデミックの間、医療従事者は最前線のヒーロ...
多くの SF 映画では、このようなシーンがよく見られます。未来の車は完全に自動化されており、必要なと...
大手物流組織はすでに配送に人工知能 (AI) を活用しています。現在、多くの企業がこのデータを収集し...
パート01 顔認識技術の概要顔認識技術は生体認証技術の一種で、人物の顔の特定の特徴(目、鼻、口、眉毛...
熱狂が冷め、合理性が戻った後、自動運転業界は再び混乱に陥っています。過去1年間、資金調達、量産計画、...
世界中の食べ物は、まさに世界の花火のボウルに過ぎません。人工知能は、新しい技術科学として、日常生活に...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[262791]]それを受け入れるかどうかは別として、突然の火災でノートルダム大聖堂は焼け落ちた...
自動運転技術は、世界中の大手自動車メーカーの主要な研究開発方向となっています。現在、多くの自動車メー...
近年、デジタル経済や市場、政策、テクノロジーなどのさまざまな要因に後押しされ、建設業界ではデジタル変...