研究者たちは、スマートデバイスがAIを使って声の発信元を判断できるようにする準備を進めている。

研究者たちは、スマートデバイスがAIを使って声の発信元を判断できるようにする準備を進めている。

このアイデアはプライバシー擁護者を怖がらせているが、スマートスピーカーの開発者は、ユーザーのウェイクワードを聞かなくてもデバイスを起動できるように取り組んでいる。 Google がすでにこの技術に取り組んでいることは知っていましたが、今ではカーネギーメロン大学の研究者たちがそれに追随し、人工知能の力を使って人の声がどの方向から来ているかを正確に判断する機械学習モデルを開発しました。

[[350720]]

一見、これはそれほど重要ではないように思えるかもしれないが、研究者たちは、IoT デバイスが家庭やオフィス全体で「ますます密集」する未来を計画している。 Alexa 搭載のスマートテレビ、スピーカー、スマートフォンがすべて 1 か所に集まっていると想像してください。ウェイクワードを言うと、これらの各デバイスでコマンド モードがアクティブになる可能性がありますが、これが必要になることはほとんどありません。

この場合、部屋全体のデバイスではなく、特定のスマート デバイスに話しかけたい場合があり、ここでこの研究が役立ちます。このコマンド不要のウェイクアップ方法が他の方法と異なるのは、顔認識技術を必要としないことです。 もちろん、このシステムの精度は、平均的なユーザーがその概念に適応できる能力に大きく依存します。たとえば、ユーザーは、家族や友人に質問するときに、誤ってスマート デバイスの方向に向かって大声で話さないようにする必要があります。しかし、この技術がすぐに一般の人々に利用可能になるとは思えません。

<<:  機械学習技術におけるアンサンブル学習とは何ですか?

>>:  指紋と顔は本当に生体認証を表現できるのでしょうか?

ブログ    
ブログ    

推薦する

...

時空間AI技術:スマートシティ分野における深層強化学習の応用入門

深層強化学習は近年人気が出てきている技術です。深層強化学習の制御および意思決定プロセスには、状態、ア...

2017年中国・米国データサイエンス比較レポート:Pythonが年間平均給与11万ドルで1位

[[208216]] ***ニュースによると、Kaggleは最近、機械学習とデータサイエンスに関する...

日本では想像以上にAIが活用されている

[[443157]]日本における人工知能の開発はますます成熟しつつあります。日本は現在、「人工知能ア...

...

これが顔認識と画像認識がますます重要になっている理由です

捜査チームがスケッチアーティストを雇って、目撃者が語った犯人像を描いてもらう犯罪番組を見たことを覚え...

大量データのための2次パーソナルコネクションマイニングアルゴリズム(Hadoop実装)

私は最近、Sina Weibo の「あなたに興味があるかもしれない人々」の間接的なフォローアップ推奨...

ロボットは人間の労働に取って代わることができるでしょうか?アディダスは悲惨な教訓を学び、涙ながらにスマート工場を閉鎖した

科学技術は主要な生産力であると言われています。いつの時代になっても、この言葉は決して古くなることはあ...

顔認識の専門家、王国天氏:人工知能、機械学習、機械視覚とは何ですか?

昨今、人工知能はますます話題になり、応用されていますが、人工知能、機械学習、マシンビジョンとは一体何...

顔認証決済だけでは不十分、マスターカードは歩行、心拍、静脈による決済を検討

[[317535]]顔認証決済や指紋認証決済だけでは不十分だ。世界的決済ソリューション大手のマスター...

自動運転のための多視点視覚認識の理解

出力次元の観点から、視覚センサーに基づく知覚方法は、2D知覚と3D知覚に分けられます。視覚システムは...

...

このGitHubの8000スターAIリアルタイム顔変換プロジェクトにはアプリがある

人間のロールプレイングへの熱意は決して衰えることがなく、だからこそ AI による顔の変形が人気を博し...

リアルタイムの高忠実度レンダリング、PlenOctrees に基づく NeRF レンダリング速度が 3000 倍に向上

[[393143]]まばらな静止画像から任意の 3D オブジェクトとシーンの新しいビューを合成するこ...