ビデオ映像から間取り図を推測する新たなAI研究は目を見張るものがある

ビデオ映像から間取り図を推測する新たなAI研究は目を見張るものがある

フロアプランは、空間を視覚化したり、ルートを計画したり、建物のデザインを伝えたりするのに役立ちます。たとえば、新しい建物に入るロボットは、フロアプランを使用して全体的なレイアウトをすばやく認識できます。通常、フロアプランを作成するには、3D センサーとカメラが空間全体をキャプチャできるように、完全なレイアウトが必要です。

1月11日、海外メディアの報道によると、フェイスブック、テキサス大学オースティン校、カーネギーメロン大学の研究者らが、視覚と音声を利用して短いビデオクリップから間取り図を再構築する人工知能技術を研究している。

[[375129]]

研究者らは、音声は画像のマッピング機能を補完する空間的および意味的な信号を提供すると主張している。これは、音が本質的に物体の形状によって駆動されるためだと彼らは言います。音が表面で反射し、カメラの視野をはるかに超えた部屋の形状が明らかになります。遠くから、たとえ数部屋離れた場所からでも聞こえる音は、音響物体が存在する可能性のある自由空間の存在を明らかにすることができます。さらに、さまざまな方向から聞こえる音は、その音が表す活動や物に基づいてレイアウトを明らかにします。たとえば、シャワーの音はバスルームの方向を示唆し、電子レンジの音はキッチンの方向を示唆する場合があります。

AV-Mapと呼ばれる研究者の手法は、マルチチャンネルオーディオ付きの短いビデオを2Dフロアプランに変換するように設計されています。機械学習モデルは、オーディオとビジュアルのデータシーケンスを利用してフロアプランの構造とセマンティクスを推測し、最後にデコードコンポーネントを使用してオーディオとビデオの情報を融合します。 AV-Map は、ビデオで直接見える領域を大幅に超えるフロア プランを生成し、空きスペースと占有エリアをファミリー ルームやキッチンなどの個別の意味的な部屋ラベルに分割して表示します。

チームは、Matternet3D および SoundSpaces データセットから抽出したデジタル環境で、アクティブとパッシブの 2 つのセットアップを試しました。最初の実験では、仮想カメラを使用して、模型の家の部屋を移動しながら既知の音を再生しました。 2 番目のケースでは、家の中の物や人が出す自然な音だけに頼ります。

研究者らは、今後の研究では複数階のフロアプランを拡張し、マッピングのアイデアをカメラを積極的に制御するロボットに結び付けることを検討する予定だと述べている。

<<:  AI教育改革の障害

>>:  気候変動と闘うためのAIの8つのガイドライン

ブログ    
ブログ    

推薦する

AI受験者が発狂!上級数学試験の正解率は81%で、競争試験のスコアはコンピュータドクターのスコアよりも高い。

上級数学の試験で悪い成績を取ることは、多くの人にとって悪夢です。高度な数学は AI ほど得意ではない...

ジェネレーティブ AI: 職場の CIO にとって未知の要素

組織のエンドユーザーとますますインテリジェントになるソフトウェア ツールとの間の生産的なパートナーシ...

2018 年に先導するオープンソース AI プロジェクトはどれでしょうか?

[[219623]] [51CTO.com クイック翻訳] 最近では、人工知能 (AI) や機械学...

ロボット工学、自動化、AIでイノベーションを加速

デジタル変革の結果、テクノロジーは長年にわたってどのように変化してきましたか?アクセンチュアが第 2...

AI戦争が近づく中、ChatGPTが軍事禁止を解除

先週末、大手人工知能企業OpenAIは、ChatGPTの使用ポリシーから軍事利用を禁止する条項をひっ...

AIと機械学習がSaaS業界にどのような変化をもたらすか

GlobalDots の CTO である Yair Green 氏が、人工知能と機械学習がサービスと...

...

自動化によって、採用担当者が大規模な適格な人材を特定する方法

AI ベースの自動化ツールは、候補者データを収集して処理し、候補者の調達、スクリーニング、多様性、そ...

...

...

Meituと中国科学技術大学が共同で顔面修復法DiffBFRを提案

ブラインド フェイス リストレーション (BFR) は、低品質の顔画像から高品質の顔画像を復元するこ...

...

データサイエンスの面接で必ず知っておくべき 5 つの質問

同じ場所で二度失敗することがないように、そして他の人の役に立つために、私は自分の情熱に従ってデータ ...

「柯潔は2つの石を与えられた」が、それでもAIに負けた。プログラマーが知っておくべきトップ10のAIライブラリとフレームワークはこちら

[51CTO.comより引用] 遅かれ早かれ、この日はやって来る。イ・セドルがアルファ碁に1対4で負...