デアデビルが来た！バットセンスAIは、スマートフォンが音を聞いて3D画像を生成できるようにする

英国の科学者たちは、スマートフォンやノートパソコンなどの日常的な物に、デアデビルと同じくらい強力なコウモリのような環境認識機能を与える方法を発見した。

[[399341]]

グラスゴー大学のコンピューター科学者と物理学者が「Physical Review Letters」誌に発表した論文で概説されているこの研究は、セキュリティやヘルスケアの分野で応用できる可能性がある。

この技術の核となるのは、コウモリがエコーロケーションを使って移動したり狩りをしたりするのと同じように、反射エコーを使って画像を生成する高度な機械学習アルゴリズムです。

研究者らが提案したアルゴリズムは、スピーカーからのサウンドクリップや小型アンテナから送信された電波パルスが部屋を通過してセンサーに戻ってくるまでの時間を測定できる。

アルゴリズムは結果を巧みに分析することで、部屋の形、大きさ、レイアウトを推測し、存在する物体や人物を選び出すことができます。

結果はエコーデータを3次元画像に変換し、ビデオとして表示されます。

この研究とコウモリのエコーロケーションとの主な違いは、コウモリには方向を定めるのに役立つ 2 つの耳があるのに対し、アルゴリズムはマイクロフォンや無線アンテナなどの単一のポイントから収集されたデータで動作するように調整されている点です。

「この技術は、マイクとスピーカー、あるいは無線アンテナを備えたあらゆるデバイスを通じて画像を生成するために使用できる可能性がある」と研究者らは述べた。

ターピン博士は、動物のエコーロケーションは驚くべき能力であり、科学はレーダーやライダーなど、反射したエコーから3D画像を生成するさまざまな方法でそれを再現することに成功したと述べた。

この研究は、以下の点で他のシステムとは異なります。

まず、3D 画像を作成するには、マイクまたはアンテナなどの単一の入力からのデータのみが必要です。

第二に、このアルゴリズムは、これら 2 つの機器のいずれかを備えたあらゆるデバイスをエコーロケーションデバイスに変換できます。

これは、このタイプの 3D イメージングのコストが大幅に削減され、多くの新しいアプリケーションが実現できることを意味します。

例えば、侵入者が反射した信号を拾うことで、カメラなしで建物を安全に守ることができます。

同じアプローチは、介護施設の虚弱患者の動きを追跡するためにも使用できます。

このシステムは、医療施設で患者の胸の上下動を追跡し、スタッフに呼吸の変化を警告するためにも使用できる。

論文では、研究者がノートパソコンのスピーカーとマイクを使ってキロヘルツ範囲の音波を生成および受信する方法を概説している。

彼らはまた、アンテナを使用してギガヘルツ範囲の無線周波数音についても同様の実験を行いました。

それぞれの試験で、研究者たちは、人が部屋の中を動き回ったときに反射する音波に関するデータを収集した。

同時に、研究者たちは、飛行時間と呼ばれるプロセスを使用して部屋の寸法を測定し、低解像度の画像を提供する特殊なカメラを使用して、部屋のデータも記録しました。

研究チームは、マイクからのエコーデータと飛行時間型カメラの画像データを組み合わせて、エコーの特定の遅延を画像と関連付けるために、機械学習アルゴリズムを何百回も繰り返してトレーニングしました。

最終的に、アルゴリズムはエコーデータのみから部屋とその内容物の非常に正確な画像を生成することを学習し、コウモリのような周囲を感知する能力を獲得しました。

この研究は、単一ピクセル検出器を使用して閃光の反射を測定することで3D画像を作成するニューラルネットワークアルゴリズムを訓練した英国チームによる以前の研究に基づいています。

ターピン博士は次のように付け加えた。「光と音を使ったこのアルゴリズム機械学習技術の有効性を実証できたことは、非常に喜ばしいことです。世界を新しい方法で認識する大きな可能性があることは明らかであり、今後さらに高解像度の画像を生成する可能性を探求し続けたいと考えています。」

<<: BI と AI が出会うとき、「最強の脳」がどのように意思決定を支援するのかを見てみましょう。

人工知能の先駆者であるIBM Watsonは殉教者となったのか？ IBMがWatsonを売却、AIは本当に失敗したのか？

デアデビルが来た！バットセンスAIは、スマートフォンが音を聞いて3D画像を生成できるようにする

人工知能の先駆者であるIBM Watsonは殉教者となったのか？ IBMがWatsonを売却、AIは本当に失敗したのか？

ロボットはどうやってコーヒーを飲みながら心臓手術を行うのでしょうか?

ワイヤレスネットワーク戦略に必要な 6 つの AI 要素

残念ながら、自然言語理解はAIがまだ克服していない分野である。

紆余曲折の続く教育＋AI。舞台裏へのシフトは、巨大企業の拡大に向けた「新たな春」となるのか？

南洋理工大学華中科技大学などの最新研究：完全自動化された「即脱獄」、大型モデルだけが大型モデルを倒せる！ NDSS

小売実店舗におけるインテリジェント機器の応用シナリオの分析

これらの「ブラックテクノロジー」は洪水対策をよりスマートにする

Newbingが他の生成AIと大きく異なる理由

推薦する

強化学習はアプリケーションにおける戦略の「最適解」を見つける

10万ドル＋26日、低コスト1000億パラメータLLMが誕生

日常生活におけるAIの応用

李開復：「AI+」には4つの段階があると考える理由

清華大学の黄敏烈氏との対話：自動運転分類を使用してAI対話システムを定義すると、メタバースの仮想コンパニオンはレベル5になる可能性がある

EU AI法が規則を承認

マイクロソフト、精度を80%以上に向上させるAIコードレビューツールを発表

機械学習におけるデータの不均衡の問題を解決するにはどうすればよいでしょうか?

オープンソース | AREX: Ctrip の次世代自動回帰テストツールの設計と実装

2019年を迎え、人工知能技術の動向はどのように発展していくのでしょうか？

7つのダイナミックなトレンドが将来のAIサービス市場を形作る