Microsoft は、全二重音声インタラクションにおいて画期的な進歩を達成しました。ロボットは本当に「人間」になる

Microsoft は、全二重音声インタラクションにおいて画期的な進歩を達成しました。ロボットは本当に「人間」になる

マイクロソフト(アジア)インターネットエンジニアリングアカデミーは、新世代の音声インタラクション技術「Full-duplex Voice Sense」の発売を先導し、製品化を完了したと発表した。

[[223494]]

全二重は通信伝送の分野における用語で、同時に 2 方向にデータを伝送できます。対応する用語は半二重です。

従来の音声認識と機械の会話は、半二重通信に似ています。1 ラウンドの認識でも、複数ラウンドの連続認識でも、機械が理解して応答する前に、人が文を言い終える必要があります。これは、従来の格闘技ゲームのターン制戦闘に少し似ています。

Microsoft の新しいテクノロジは、人間が何を言おうとしているかをリアルタイムで予測し、リアルタイムで応答を生成し、会話のリズムを制御できるため、長距離の音声対話が可能になります。

この技術を使用するスマート ハードウェア デバイスでは、ユーザーは対話のたびにウェイクアップ ワードを言う必要がありません。 1 回のウェイクアップだけで継続的な会話を簡単に実現できるため、人間と機械の間の会話は、人間同士の自然なコミュニケーションに近くなります。

現在、この技術はマイクロソフトのXiaoiceのグローバル製品ラインに初めて実装されています。中国市場では、中国科学技術博物館のXiaoice電話ブースだけでなく、マイクロソフトはXiaomiと緊密に協力して、MiエコシステムのYeelight音声アシスタントの市販ハードウェア製品にこの技術を統合しています。

これは、全二重音声対話感覚機能を搭載した世界初のスマートデバイスであり、Microsoft XiaoIceを内蔵した初の「デュアルAI」スマートデバイスでもあります。

日本市場では、この技術を通じて「りんな」がライブ放送プラットフォームに実装され、***車載インテリジェントプロジェクトも路上テストを開始しました。

マイクロソフトは、今後 6 か月以内にこのテクノロジをさらに多くの製品ラインに拡大する予定です。

マイクロソフトのグローバル上級副社長兼マイクロソフトインターネットエンジニアリングアカデミー(アジア)の社長である王永東博士は次のように述べた。「今後1年間で、人工知能の応用は特定の技術分野から総合的な能力を発揮する段階へとますます移行すると予測しています。マイクロソフトはこの点について綿密な準備を進めてきました。全二重音声対話技術の発表は、コンピューター音声技術だけでなく、自然言語処理、人工知能コンテンツ作成などの分野も含みます。これは、これらの分野におけるマイクロソフトの長期にわたる準備と総合的な応用の結果の1つです。」

Microsoft XiaoIce のグローバル R&D 責任者である Zhou Li 博士は、次のように述べています。「実装された製品データとユーザー フィードバックから、共通の現象が観察されました。ユーザーが Microsoft XiaoIce の全二重音声対話感覚体験を使用すると、他の音声アシスタントとの対話に不快感を覚えるようになり、他の音声アシスタントに起動ワードを言うのを忘れることも頻繁にあります。新しいテクノロジにより、擬人化の自然さが大幅に向上し、従来の 1 回限りまたは複数回の連続音声対話体験に対するユーザーの満足度が急速に低下しました。古いものと新しいものを交互に使用するこの現象は、当社の R&D の期待と一致しています。」

<<:  AI as a Service: AIとクラウドコンピューティングが出会うとき

>>:  AIとIoTが教育に与える影響

ブログ    
ブログ    

推薦する

673本の論文を要約し、UIUCなどが20ヶ月で完成させた信頼性の高い機械学習レビューを発表

少し前、UIUC と南洋理工大学の 3 人の研究者が 20 か月かけて 673 本の論文を研究し、信...

自動運転車の長所と短所

長年にわたる技術の進歩により、交通はより便利になりました。 IoT アプリケーションなどの自動車技術...

...

2024年に誰もが備えるべき5つのテクノロジートレンド

機械知能、現実と仮想の境界線の曖昧化、そしてインターネットの継続的な進化は、私たちの生活に根本的な影...

...

...

DeepSpeed ZeRO++: ネットワーク通信を4倍削減し、大規模モデルやChatGPTのようなモデルのトレーニング効率を大幅に向上

大規模な AI モデルがデジタルの世界を変えています。大規模言語モデル (LLM) に基づく Tur...

人工知能はいつか本当に人間の教師に取って代わることができるのでしょうか?

中国は教育における人工知能の応用において徐々に優位に立っています。顔認識からスタートアップ、医療教育...

...

...

...

2021年に注目すべき5つのAIトレンド

[[392513]] 2020年にCOVID-19が世界的に猛威を振るう中、人々は人工知能技術の助け...

AI はクラウド コンピューティングをどのように改善するのでしょうか?

今日、AI とクラウド コンピューティングを組み合わせることで、企業はデータを管理し、情報のパターン...

Java データ構造とアルゴリズム分析 (VIII) - スプレー ツリー

ストレッチツリーの紹介スプレー ツリーは特殊な二分探索ツリーです。特別なのは、バイナリ検索ツリーであ...

...