最近、Alibaba AI は新世代の人間とコンピュータの対話モデル ESIM をオープンソース化しました。このアルゴリズムモデルは2年以上前に提案され、GoogleやFacebookを含む国際的な学術界の200以上の論文で引用されています。また、国際対話システムテストコンペティション(DSTC7)でダブル優勝し、人間とコンピューターの対話精度の世界記録を94.1%に引き上げました。 ESIM モデルは、もともと DAMO アカデミーの音声研究室の 90 年代以降の科学者である Chen Qian によって開発されました。現在では、業界で人気のモデルおよび共通標準となっています。平均年齢30歳のR&Dチームは、今後、ESIMモデルを世界中の企業や個人にオープンソース化し、この成果を世界中の開発者と共有し、人工知能技術の開発を共同で推進していくと発表した。 アリババは、自社開発の人間と機械の対話応答モデルESIMをGitHubプラットフォームでオープンソース化した。 昨年の DSTC 7 大会では、ESIM が MIT、ジョンズ・ホプキンス大学、IBM リサーチなどから約 20 の参加チームから抜きんでて NOESIS トラックを席巻し、このトラックの 2 つの大会で優勝しました。 DSTC は、学術界における権威ある対話システム評価コンテストです。2013 年に Microsoft Research とカーネギーメロン大学の科学者によって開始され、今年で 8 回目を迎えます。 NOESIS トラックでは、人間とコンピュータの対話を行う AI の能力を検証します。AI は、複数ラウンドにわたる人間とコンピュータの対話履歴に基づいて、数百から数万の文から正しい応答を選択する必要があります。 人間とコンピュータの対話システムとその背後にある認知知能は、人間とコンピュータの相互作用において最も複雑かつ重要な技術です。かつてビル・ゲイツはこれを「人工知能の至宝」と評しました。 ESIMは、機械が人間の表現を迅速かつ正確に理解できるようにするために、AIに「レーダー」システムを搭載し、会話履歴をリアルタイムに取得して干渉情報を自動的に除去し、人間が期待する応答を返すことができるようにしました。 この画期的な進歩は、インテリジェントな顧客サービス、ナビゲーションソフトウェア、スマートスピーカーなどのアプリケーションシナリオに大きな変化をもたらすでしょう。アリババがESIMモデルに基づいて開発したインテリジェント音声注文機や地下鉄音声チケット機などのアプリケーションは、杭州、上海などですでに実装されています。 アリババが最先端技術をオープンソース化するのは今回が初めてではない。 2018年、DAMOアカデミーは次世代音声認識モデルDFSMNをオープンソース化し、多くの研究者がこのモデルに基づいて研究するようになり、音声認識の世界記録を再び更新しました。 |
>>: 北京初のT5レベル閉鎖型自動運転試験場が正式に運用開始
2021年5月20日、北京中良プロトンネットワーク情報技術有限公司傘下の企業向けデジタルサービスプラ...
[[433247]]包装食品の需要増加により、食品ロボット市場規模の成長が促進されると予想されます。...
以前、LeNet、AlexNet、Vgg についてお話しましたが、今週は GoogLeNet につい...
2020年8月20日から22日まで、北京で「人工知能と未来の教育」に重点を置いた、待望の「2020年...
[51CTO.com クイック翻訳]ビジネスの世界では、デジタルトランスフォーメーションという言葉を...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
昨日、私はこのような図を見ました。AI がどのように人間に取って代わるかを示すレベル図です。写真写真...
データ サイエンティストとして、業界のトップ ナレッジ グラフをまとめ、技術専門家と共有して、ビッグ...
日常生活では、情報を提示する次の 2 つの方法によく遭遇します。表示される情報量はどちらも同じですが...
人工知能と機械学習の技術が進歩するにつれ、企業や組織は競争上の優位性を得るためにこれらの機能を活用す...
テンセントは12月30日、同社の人工知能チームが第1回Google Football Kaggleコ...
[[342720]] 人工知能の分野でのこの国の雇用機会はどのようなものでしょうか?私たちはすべてが...
Google Gemini の中国語コーパスは Wenxin Yiyan から来ていると思われます...