最近、Alibaba AI は新世代の人間とコンピュータの対話モデル ESIM をオープンソース化しました。このアルゴリズムモデルは2年以上前に提案され、GoogleやFacebookを含む国際的な学術界の200以上の論文で引用されています。また、国際対話システムテストコンペティション(DSTC7)でダブル優勝し、人間とコンピューターの対話精度の世界記録を94.1%に引き上げました。 ESIM モデルは、もともと DAMO アカデミーの音声研究室の 90 年代以降の科学者である Chen Qian によって開発されました。現在では、業界で人気のモデルおよび共通標準となっています。平均年齢30歳のR&Dチームは、今後、ESIMモデルを世界中の企業や個人にオープンソース化し、この成果を世界中の開発者と共有し、人工知能技術の開発を共同で推進していくと発表した。 アリババは、自社開発の人間と機械の対話応答モデルESIMをGitHubプラットフォームでオープンソース化した。 昨年の DSTC 7 大会では、ESIM が MIT、ジョンズ・ホプキンス大学、IBM リサーチなどから約 20 の参加チームから抜きんでて NOESIS トラックを席巻し、このトラックの 2 つの大会で優勝しました。 DSTC は、学術界における権威ある対話システム評価コンテストです。2013 年に Microsoft Research とカーネギーメロン大学の科学者によって開始され、今年で 8 回目を迎えます。 NOESIS トラックでは、人間とコンピュータの対話を行う AI の能力を検証します。AI は、複数ラウンドにわたる人間とコンピュータの対話履歴に基づいて、数百から数万の文から正しい応答を選択する必要があります。 人間とコンピュータの対話システムとその背後にある認知知能は、人間とコンピュータの相互作用において最も複雑かつ重要な技術です。かつてビル・ゲイツはこれを「人工知能の至宝」と評しました。 ESIMは、機械が人間の表現を迅速かつ正確に理解できるようにするために、AIに「レーダー」システムを搭載し、会話履歴をリアルタイムに取得して干渉情報を自動的に除去し、人間が期待する応答を返すことができるようにしました。 この画期的な進歩は、インテリジェントな顧客サービス、ナビゲーションソフトウェア、スマートスピーカーなどのアプリケーションシナリオに大きな変化をもたらすでしょう。アリババがESIMモデルに基づいて開発したインテリジェント音声注文機や地下鉄音声チケット機などのアプリケーションは、杭州、上海などですでに実装されています。 アリババが最先端技術をオープンソース化するのは今回が初めてではない。 2018年、DAMOアカデミーは次世代音声認識モデルDFSMNをオープンソース化し、多くの研究者がこのモデルに基づいて研究するようになり、音声認識の世界記録を再び更新しました。 |
>>: 北京初のT5レベル閉鎖型自動運転試験場が正式に運用開始
ドイツ、米国、フランスの研究者で構成された研究チームは、10万枚以上の画像を使用して、畳み込みニュー...
人工知能は、データセンターのリソース管理において前例のない役割を果たしています。 AI テクノロジー...
人工知能ツールによって特定された、火星の最新のクレーター群の高解像度画像。画像出典: Space.c...
最小限の労力で最も効率的な PyTorch トレーニングを完了するにはどうすればよいでしょうか? P...
この ASO チュートリアル シリーズを初めて読む場合は、最初の記事から始めることをお勧めします。 ...
おそらく、どの分野においても、頭を下げて突き進むことと同じくらい、立ち止まって考えることが大切なので...
7月9日、2020年世界人工知能会議クラウドサミットが正式に開幕しました。 AI という SF 用語...
[[438791]]この記事はWeChat公式アカウント「地道学院」から転載したもので、著者は地道...
[[443127]]ビッグデータの時代において、機械学習は製品の売上向上や人間の意思決定の支援に大き...
コンピューターサイエンスとエンジニアリングの主要会員コミュニティである IEEE コンピューターソサ...
現在、AI によって完全に有効化されたプロセスを備えている企業はわずか 25% であり、これらの企業...
[[191502]]ディープラーニング技術を使用して問題を解決する際に最もよく見られる障害は、モデル...
現在の技術の進歩と産業の発展に伴い、産業用ロボットの応用分野も急速に拡大しています。企業は、労働コス...