デアデビルが来た!バットセンスAIは、スマートフォンが音を聞いて3D画像を生成できるようにする

デアデビルが来た!バットセンスAIは、スマートフォンが音を聞いて3D画像を生成できるようにする

英国の科学者たちは、スマートフォンやノートパソコンなどの日常的な物に、デアデビルと同じくらい強力なコウモリのような環境認識機能を与える方法を発見した。

[[399341]]

グラスゴー大学のコンピューター科学者と物理学者が「Physical Review Letters」誌に発表した論文で概説されているこの研究は、セキュリティやヘルスケアの分野で応用できる可能性がある。

この技術の核となるのは、コウモリがエコーロケーションを使って移動したり狩りをしたりするのと同じように、反射エコーを使って画像を生成する高度な機械学習アルゴリズムです。

研究者らが提案したアルゴリズムは、スピーカーからのサウンドクリップや小型アンテナから送信された電波パルスが部屋を通過してセンサーに戻ってくるまでの時間を測定できる。

アルゴリズムは結果を巧みに分析することで、部屋の形、大きさ、レイアウトを推測し、存在する物体や人物を選び出すことができます。

結果はエコーデータを3次元画像に変換し、ビデオとして表示されます。

この研究とコウモリのエコーロケーションとの主な違いは、コウモリには方向を定めるのに役立つ 2 つの耳があるのに対し、アルゴリズムはマイクロフォンや無線アンテナなどの単一のポイントから収集されたデータで動作するように調整されている点です。

[[399342]]

「この技術は、マイクとスピーカー、あるいは無線アンテナを備えたあらゆるデバイスを通じて画像を生成するために使用できる可能性がある」と研究者らは述べた。

ターピン博士は、動物のエコーロケーションは驚くべき能力であり、科学はレーダーやライダーなど、反射したエコーから3D画像を生成するさまざまな方法でそれを再現することに成功したと述べた。

この研究は、以下の点で他のシステムとは異なります。

まず、3D 画像を作成するには、マイクまたはアンテナなどの単一の入力からのデータのみが必要です。

第二に、このアルゴリズムは、これら 2 つの機器のいずれかを備えたあらゆるデバイスをエコーロケーション デバイスに変換できます。

これは、このタイプの 3D イメージングのコストが大幅に削減され、多くの新しいアプリケーションが実現できることを意味します。

例えば、侵入者が反射した信号を拾うことで、カメラなしで建物を安全に守ることができます。

同じアプローチは、介護施設の虚弱患者の動きを追跡するためにも使用できます。

このシステムは、医療施設で患者の胸の上下動を追跡し、スタッフに呼吸の変化を警告するためにも使用できる。

論文では、研究者がノートパソコンのスピーカーとマイクを使ってキロヘルツ範囲の音波を生成および受信する方法を概説している。

彼らはまた、アンテナを使用してギガヘルツ範囲の無線周波数音についても同様の実験を行いました。

それぞれの試験で、研究者たちは、人が部屋の中を動き回ったときに反射する音波に関するデータを収集した。

同時に、研究者たちは、飛行時間と呼ばれるプロセスを使用して部屋の寸法を測定し、低解像度の画像を提供する特殊なカメラを使用して、部屋のデータも記録しました。

研究チームは、マイクからのエコーデータと飛行時間型カメラの画像データを組み合わせて、エコーの特定の遅延を画像と関連付けるために、機械学習アルゴリズムを何百回も繰り返してトレーニングしました。

最終的に、アルゴリズムはエコーデータのみから部屋とその内容物の非常に正確な画像を生成することを学習し、コウモリのような周囲を感知する能力を獲得しました。

この研究は、単一ピクセル検出器を使用して閃光の反射を測定することで3D画像を作成するニューラルネットワークアルゴリズムを訓練した英国チームによる以前の研究に基づいています。

ターピン博士は次のように付け加えた。「光と音を使ったこのアルゴリズム機械学習技術の有効性を実証できたことは、非常に喜ばしいことです。世界を新しい方法で認識する大きな可能性があることは明らかであり、今後さらに高解像度の画像を生成する可能性を探求し続けたいと考えています。」

<<:  BI と AI が出会うとき、「最強の脳」がどのように意思決定を支援するのかを見てみましょう。

>>:  ガートナーの最新のマジック・クアドラントレポートでは、IBMがエンタープライズAIテクノロジーのグローバルリーダーであると示されています。

ブログ    
ブログ    
ブログ    

推薦する

初のオープンソースMoE大型モデル公開! 7Bx8の専門家、GPT-4に最も近いエピソード

「今夜の予定は全部キャンセル!」多くのAI開発者は寝ないことを決意しました。最初のオープンソース M...

レポート:データセンターは人工知能を生成するサーバーを冷却するために大量の水を消費している

ChatGPT のような生成 AI モデルが大量のエネルギーを消費することはよく知られていますが、そ...

Metaは、すべての製品のビデオ推奨エンジンをサポートする巨大なAIモデルを構築しています。

3月7日水曜日、Metaの上級幹部は米国時間、同社がFacebookを含む傘下のさまざまなプラット...

交通における人工知能: スマートソリューションによる交通革命

人工知能 (AI) は世界中の産業に変化をもたらしており、交通も例外ではありません。テクノロジーが進...

都市と市民がスマートシティ技術から得られる恩恵

テクノロジーは非常に効率的かつ完璧なので、私たちはそれに気付くことすらありません。しかし、通勤時間が...

AIデータのラベル付けは大量にアウトソーシングされており、南アフリカ、ベネズエラなどの国の人々はデジタル搾取の運命から逃れられない

歴史的に、これらの国や地域は旧植民地帝国によって貧困化しており、ヨーロッパの植民地主義は土地の暴力的...

犯罪を予測する人工知能(AI)の倫理的・法的危機

あなたが通りを歩いていると、突然パトカーが止まり、数人の警官が飛び降りてきて、あなたの腕をつかみ、逮...

0パラメータ+0トレーニング、3D点群解析手法Point-NNは複数のSOTAを更新します

論文リンク: https://arxiv.org/pdf/2303.08134.pdfコードアドレス...

海外の子どもたちはみんなプログラミングを学んでいますが、彼らが学んでいるのはプログラミングではなく、プログラミング的思考なのです!

人工知能が話題になるにつれ、コーディングも親たちの注目の的になっています。実は、子どもにプログラミン...

...

シングルポイントのエンドツーエンドのテキスト検出および認識フレームワークは 19 倍高速です。華中科技大学、華南理工大学などが共同でSPTS v2をリリース

近年、シーンテキスト読み取り(テキストスポッティング)は大きな進歩を遂げており、テキストの検索と認識...

人工知能は社会統治の近代化を効果的に促進できる

現在、人類は急速に人工知能の時代に突入しています。人工知能技術の急速な発展、モノのインターネット、ビ...