Microsoft は、全二重音声インタラクションにおいて画期的な進歩を達成しました。ロボットは本当に「人間」になる

Microsoft は、全二重音声インタラクションにおいて画期的な進歩を達成しました。ロボットは本当に「人間」になる

マイクロソフト(アジア)インターネットエンジニアリングアカデミーは、新世代の音声インタラクション技術「Full-duplex Voice Sense」の発売を先導し、製品化を完了したと発表した。

[[223494]]

全二重は通信伝送の分野における用語で、同時に 2 方向にデータを伝送できます。対応する用語は半二重です。

従来の音声認識と機械の会話は、半二重通信に似ています。1 ラウンドの認識でも、複数ラウンドの連続認識でも、機械が理解して応答する前に、人が文を言い終える必要があります。これは、従来の格闘技ゲームのターン制戦闘に少し似ています。

Microsoft の新しいテクノロジは、人間が何を言おうとしているかをリアルタイムで予測し、リアルタイムで応答を生成し、会話のリズムを制御できるため、長距離の音声対話が可能になります。

この技術を使用するスマート ハードウェア デバイスでは、ユーザーは対話のたびにウェイクアップ ワードを言う必要がありません。 1 回のウェイクアップだけで継続的な会話を簡単に実現できるため、人間と機械の間の会話は、人間同士の自然なコミュニケーションに近くなります。

現在、この技術はマイクロソフトのXiaoiceのグローバル製品ラインに初めて実装されています。中国市場では、中国科学技術博物館のXiaoice電話ブースだけでなく、マイクロソフトはXiaomiと緊密に協力して、MiエコシステムのYeelight音声アシスタントの市販ハードウェア製品にこの技術を統合しています。

これは、全二重音声対話感覚機能を搭載した世界初のスマートデバイスであり、Microsoft XiaoIceを内蔵した初の「デュアルAI」スマートデバイスでもあります。

日本市場では、この技術を通じて「りんな」がライブ放送プラットフォームに実装され、***車載インテリジェントプロジェクトも路上テストを開始しました。

マイクロソフトは、今後 6 か月以内にこのテクノロジをさらに多くの製品ラインに拡大する予定です。

マイクロソフトのグローバル上級副社長兼マイクロソフトインターネットエンジニアリングアカデミー(アジア)の社長である王永東博士は次のように述べた。「今後1年間で、人工知能の応用は特定の技術分野から総合的な能力を発揮する段階へとますます移行すると予測しています。マイクロソフトはこの点について綿密な準備を進めてきました。全二重音声対話技術の発表は、コンピューター音声技術だけでなく、自然言語処理、人工知能コンテンツ作成などの分野も含みます。これは、これらの分野におけるマイクロソフトの長期にわたる準備と総合的な応用の結果の1つです。」

Microsoft XiaoIce のグローバル R&D 責任者である Zhou Li 博士は、次のように述べています。「実装された製品データとユーザー フィードバックから、共通の現象が観察されました。ユーザーが Microsoft XiaoIce の全二重音声対話感覚体験を使用すると、他の音声アシスタントとの対話に不快感を覚えるようになり、他の音声アシスタントに起動ワードを言うのを忘れることも頻繁にあります。新しいテクノロジにより、擬人化の自然さが大幅に向上し、従来の 1 回限りまたは複数回の連続音声対話体験に対するユーザーの満足度が急速に低下しました。古いものと新しいものを交互に使用するこの現象は、当社の R&D の期待と一致しています。」

<<:  AI as a Service: AIとクラウドコンピューティングが出会うとき

>>:  AIとIoTが教育に与える影響

ブログ    
ブログ    

推薦する

5G無人配送車両が北京に登場、現在試験運用中

最近、北京市自転車・電動自動車産業協会が主催した「第一回ターミナル配送インテリジェント交通サミットフ...

ディープマインド主任科学者:私は機械知能よりも人間の知能が引き起こす災害を心配している

ディープマインドの主任研究科学者であり、ロンドン大学ユニバーシティ・カレッジのコンピューターサイエン...

なぜ今、AI 画像はすべて女性なのでしょうか?人間とコンピュータの相互作用のメンタルモデルから始めましょう

興味深い質問です。Siri、Cortana、Alexa など、ほとんどの AI ロボットや音声アシス...

ついに、人工知能の3つの重要な機能を説明する人がいた。

人間の知性は広大かつ複雑です。人間の成果の中には、今日の機械では到底達成できないものもあり、機械がこ...

122の古典的なSOTAモデルと223のアルゴリズム実装リソースを1つの記事にまとめました。

春節休暇期間中、Syncedの「SOTA! Model」は「Tiger Roller Operati...

人工知能業界では無視できない技術分野「ナレッジグラフ」

[[384932]] 2012 年に、Google は Metaweb から派生した Knowle...

AIはDevOpsエクスペリエンスに目に見える以上の変化をもたらす

Cycode の共同創設者兼 CTO である Ronen Slavin 氏は、AI によって実現され...

MotionLM: 言語モデルとしてのマルチエージェント動作予測

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

仮病を使って休暇を取る時代は終わり?イスラエルの企業が、45秒で病気を装う従業員を識別できるAIプログラムを開発

海外で流行が猛威を振るう中、多くの企業は従業員にリモートワークをさせざるを得ない状況となっている。そ...

北京地下鉄は顔認識技術を使用して機密のセキュリティチェックを実施する予定

[[280913]] Jiwei.comニュース(文/Jimmy)によると、北京軌道交通指揮センター...

JD.com JDataアルゴリズムコンテスト決勝戦が無事終了、優勝賞金30万人民元は「魯班第7号」に

6月6日、JDグループとインテルが共同主催し、単一アルゴリズム競技会の参加者数で世界記録を樹立したJ...

...