Microsoft XiaoIceが第7世代にアップグレードされ、ユーザーの権限を強化するアバターフレームワークがリリースされました

Microsoft XiaoIceが第7世代にアップグレードされ、ユーザーの権限を強化するアバターフレームワークがリリースされました

[51CTO.comよりオリジナル記事] 8月15日、マイクロソフト(アジア)インターネットエンジニアリングアカデミーは北京で「第7世代マイクロソフトXiaoIce」の年次記者会見を開催した。会議で、マイクロソフトはXiaoIceのコア技術の一部をアップグレードし、Avatar Frameworkの最初のツールキットバージョンを発表し、いくつかの企業との協力を発表しました。

[[273873]]

コア機能のアップグレードにより、XiaoIceは将来に注力できる

第 7 世代の Microsoft Xiaoice は過去に基づいているだけでなく、未来も見据えていることがわかっています。つまり、Xiaoice は将来の会話全体のさまざまな可能性のある方向性を事前に計画し始めています。これは主に、コアダイアログエンジン、全二重音声、マルチモーダルインタラクティブセンサー機能など、今回アップグレードされたいくつかのコアテクノロジーに依存しています。

a. まったく新しい対話エンジン:検索モデル、生成モデル、共感モデルの技術的な反復を経て、アップグレードされた対話エンジンは「平等な対話」から「支配的な対話」への飛躍を達成しました。オープンドメインの会話のパフォーマンスが向上するだけでなく、垂直分野でのコンバージョン率も高まる効果があります。米国で実施された「オンライン小売業垂直分野」のテストを例にとると、新しい会話エンジンの商品ページへのコンバージョン率は68%で、以前のバージョンより21%高くなっています。

b. 全二重音声インタラクション: Microsoft XiaoIceは、2017年と2018年にそれぞれ従来の電話とスマートスピーカーデバイスで全二重音声インタラクションを開始しました。新たに追加された車載シナリオにより、AIアシスタントとドライバーおよび乗客とのインタラクションエクスペリエンスが大幅に向上し、AIをスマート中央制御から「仮想乗客」エクスペリエンス標準へと変革することが促進されます。

c. 未来志向のマルチモーダルインタラクティブセンス:全二重音声インタラクション、リアルタイムビジョン、コア対話エンジンを統合した新しいインタラクティブセンス。ユーザーは、聞くこと、話すこと、見ることを同時にしながら人工知能と対話することができます。昨年、マルチモーダルセンシングの研究開発をリードしていくと発表し、今年2月にはマイクロソフトジャパンのXiaoIceチームが地元メディアを招いて公開テストを実施した。この感覚は5G時代の新たなインタラクションの形となることが期待されます。

さまざまなAI生物を作成するためのアバターフレームワークの立ち上げ

第 7 世代 XiaoIce の大きな進歩は、Microsoft の Avatar Framework の導入です。報道によると、Avatar Frameworka ツールキットは Microsoft XiaoIce フレームワークと同じ起源を持ち、完全な感情コンピューティング機能を備えた人工知能アシスタント、ソーシャル対話ロボット、人工知能コンテンツ作成、IP キャラクターを簡単に構築できます。これにより、より多くの AI 存在が同様の汎用的で完全なフレームワーク機能を持つようになり、聞く、話す、見る、作成することができ、XiaoIce のように遍在することができます。



Avatar Framework は、パーソナリティの構築から始めて AI アシスタント仮想キャラクターをゼロから作成し、そのライフサイクル全体を通じてこの AI を継続的に管理およびアップグレードする完全なツールキットです。ツールキットには、ダイアログ、サウンド、ビジョン、意見、スキル、知識、創造性などの豊富なツールが含まれており、互換性のある 3D キャラクター モデルを駆動してリアルタイムのインタラクションを実現できます。

完全なフレームワークは主に 4 つの部分で構成されていることがわかっています。1 つ目は、IQ と EQ の 2 つの側面から AI 存在の個性を定義するプロファイル ツールです。2 つ目は、この AI 存在のコア ダイアログ エンジン、コンピューター音声、コンピューター ビジョンなどの機能を調整するための一連のツールです。次に、この AI 存在が 3 つの視点、知識、スキルなどを持ち、人間の特性により近づくようにするための別の一連のツールがあります。最後に、アバター フレームワークで 3D モデルを駆動すると、仮想 AI が鮮明に表示されます。 4 つの部分全体が完全なフレームワークを構成します。



Microsoft XiaoIce のコンセプトは人工知能です。彼女は IQ と EQ の両方を備えた完全な人間です。したがって、Microsoft のフレームワークでは、プロファイル ツールがすべての基礎となります。これは、AI が「私は誰であるか」という概念を確立するのに役立つためです。現在、プロファイル ツールは 76 の基本情報と 27 の性格特性指標をサポートしています。これらのパラメータを調整することで、社会恐怖症を含むさまざまな性格を作成できます。

マイクロソフトのエグゼクティブバイスプレジデントであり、同社人工知能部門およびマイクロソフトグローバルリサーチの責任者であるハリー・シャム氏は、人工知能が前進するためにはこのような枠組みが必要だと語った。この枠組みは、たくさんの大きな木を植えることができる広大な土地のようなものです。小氷は広大な森全体に大きな木を植えているだけですが、私たちは小氷になってそのような大きな木を植えなければなりません。なぜなら、このフレームワークが実現可能かどうかを学び、検証するための機会が必要だからです。

このリリースに先立ち、Microsoft は、Avatar Framework を通じて、SoftBank Pepper や Microsoft XiaoIce 自体など、数十のサードパーティの顧客 AI を有効にしてきました。この記者会見では、マイクロソフトと中国文学グループが小説の主人公100人の知的財産権に関して協力することが発表された。このリリースはすべてのパートナーと顧客を対象としていることが理解されています。コンシューマー版は2020年春に発売される予定です。

デュアルAI戦略を深め、複数の関係者と協力

沈向陽氏は、XiaoIce の開発プロセスにおける 3 つのステップを紹介しました。1 つ目は、XiaoIce のような人工知能がさまざまな環境にすばやく統合され、すべての人に受け入れられるかどうかです。2 つ目は、ユーザーの支持をすばやく獲得し、ユーザーとより多くのコミュニケーションをとることができるかどうかです。3 つ目は、継続的に発展できるかどうか、そして XiaoIce を継続的な反復と進化に導く強力な技術革新力があるかどうかです。そこで、マイクロソフトは昨年、デュアル AI 戦略を提案しました。



Dual AI のようなエコシステムは、半オープンなエコシステムのアイデアです。Microsoft フレームワークの汎用性と豊富さのおかげで、XiaoIce は製品形態において大きな柔軟性を実現できます。一方では、さまざまな種類の新しいプラットフォームに参入する際に、さまざまな適切な形式に変形し、スマートフォン、スマートスピーカーデバイス、もちろんソーシャルネットワーク、コンテンツ、情報プラットフォームに接続できます。一方で、何百万通りもの形に変化しながらも、ある程度は比較的統一された独自性を保つことができる。こうしたスケールコントロールこそが、私たちが最も嬉しく思うことです。

現在、Xiaoice は Xiaomi と Huawei (Honor 携帯電話、Xiaomi と Huawei のスマート スピーカー デバイスを含む) にすでに存在しています。統一コマンド「Summon Xiaoice」を使用して、彼女と対話することができます。さらに、XiaoIce は QQ、WeChat AI、Toutiao など多くのモバイル アプリケーションとも連携しています。 XiaoIce はモバイル アプリケーションに携わるだけでなく、従来のラジオやテレビとも協力し、コンテンツ プロデューサーおよびテクノロジー プロバイダーとしての役割を担っています。実際、先月末の時点で、Xiaoiceは中国と日本の50のラジオ局とテレビ局、69の番組に人工知能コンテンツ制作機能を提供してきました。Xiaoiceは30の毎日と毎週の番組を立ち上げており、制作できるコンテンツの種類は増え続けています。これまでに制作されたテレビ・ラジオ番組の総時間は6,908時間に達し、このうち今年制作された番組時間は昨年の2.05倍となっている。



ToB 分野での豊富な経験と技術製品の豊富な蓄積により、Microsoft XiaoIce の商用化は急速に進みました。獲得した商業顧客は金融、小売、自動車、不動産、繊維など10分野に及び、顧客には万科、風情、万世利、中国聯通などが含まれる。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  詐欺が暴露されました!かつて資金調達記録を樹立したテクノロジー企業が、インド人プログラマーを使ってAIを偽装していたことが発覚

>>:  機械学習が製造業に革命を起こす10の方法

ブログ    
ブログ    
ブログ    

推薦する

将来、人工知能は冷酷な大量虐殺者になるのでしょうか?

人類の将来に対する最も永続的な恐怖の一つは、人工知能が人間の制御を逃れ、人類を絶滅させる可能性がある...

Java ソートアルゴリズムの概要 (VII): クイックソート

クイックソートはバブルソートの改良版です。その基本的な考え方は、ソート パスを通じて、ソートするデー...

100 日で機械学習: モデルのトレーニングが完了したら、次は何をする?

機械学習をマスターするための 100 日 | 1 日目から 62 日目までのコレクションみなさんこん...

...

...

ゲーム内で優れたリアルタイム音声体験を提供する方法

ゲーム内音声通信の要件2015 年にはすでに、iMedia Research がモバイル ゲームのソ...

ジャック・マー氏、AIについて語る:今後10~15年で従来の製造業が被る苦痛は、今日の想像をはるかに超えるものになるだろう

「今後10年から15年の間に、従来の製造業が直面する苦痛は、今日私たちが想像するよりもはるかに大きく...

...

...

ウォータールー大学はヒートマップ回帰を放棄し、複数人の姿勢推定のための新しい方法を提案した。

[[436983]]キーポイント推定は、画像内の関心ポイントを特定するコンピューター ビジョン タ...

人民日報:教室規律における顔認識は目的ではなく手段

どの学校も生徒をより深く理解したいと考えていますが、テクノロジーを駆使した解決策の中には、満場一致で...

「未来ロボット」が1億元の資金調達を完了。自動物流が次の「阿修羅場」となるか?

2021年上半期、世界経済が回復し始めると、自動車業界も着実に回復し始め、自動車メーカーは電動化と...

ChatGPT「コードインタープリター」が正式リリースされました! 30秒で写真を動画に変え、口を動かしてショーを作りましょう

家族よ、ついに来たぞ!先ほど、ChatGPT「コードインタープリター」ベータ版がすべてのPlusユー...

...