最近、アリババDAMOアカデミーの機械知能研究所は、新世代の音声認識モデルDFSMNを発表しました。世界最大の無料音声認識データベースLibriSpeechのデータによると、音声認識モデルDFSMNは、世界の音声認識精度記録を96.04%まで引き上げました。 DAMOアカデミー機械知能研究所の音声認識チームが音声認識モデルDFSMNの研究開発を主導し、世界中の企業や個人にオープンソースとして公開しました。最も広く使用されている LSTM モデルと比較すると、DFSMN モデルはトレーニング速度が速く、認識精度も高くなります。新しい DFSMN モデルを搭載したスマート スピーカーやスマート ホーム デバイスは、従来のディープラーニング トレーニングよりも 3 倍高速で、音声認識は 2 倍高速です。 雲奇会議武漢サミットでは、DFSMN音声認識モデルを搭載した「AIレジ係」と実際の店員との間で興味深い競争が行われました。騒がしい環境の中で、「AIレジ係」はユーザーの音声注文を正確に認識し、わずか49秒で34杯のコーヒーを注文しました。 DFSMN 音声認識モデルは、スマート注文受付「ウェイター」に使用されているだけでなく、上海地下鉄の券売機にも使用されています。 音声認識の著名な専門家で、西北工科大学の教授である謝磊氏は、「アリババが今回ソースを公開したDFSMNモデルは、音声認識精度の着実な向上において画期的な進歩を遂げた。これは、近年の音声認識分野におけるディープラーニングの最も代表的な成果の一つであり、世界の学術界とAI技術の応用に大きな影響を与えている」と述べた。 |
>>: 私の国のロボット産業には隠れた懸念があります。すべての関係者が協力して高品質の開発を推進します
みなさんこんにちは。JavaプログラマーのChenです。最近、Open AIが再び人気を集めており、...
[[258822]] [51CTO.com クイック翻訳] 音声アシスト技術は非常に人気があり、すで...
デジタル化の大きな波の中で、一見些細な失敗が、深い疑問を浮かび上がらせます。それは、企業が業務に人工...
生成 AI は 2022 年末までに世界を席巻し、2023 年には AI 分野が脚光を浴びることにな...
RAG は、2023 年に最も人気のある LLM ベースのアプリケーション システム アーキテクチャ...
研究によると、漢字の文字の順序は必ずしも読み方に影響しない(英語の場合は各単語の文字の順序が影響する...
著者 | 崔昊レビュー | Chonglouまとめこの記事では、マルチモーダル技術分野における Op...
2021年9月9日、「大空に舞い上がる希望、素晴らしいビジョンを持つ」2021年グッドホープパートナ...
Dlib は、プログラミング言語 C++ で記述された汎用のクロスプラットフォーム ソフトウェア ラ...
ディープラーニングを使用して株価を予測することは、以前は少し神秘的に思えたかもしれませんが、新しいこ...
コード設計では、このようなシナリオによく直面します。2 つの要素が与えられた場合、それらが同じセット...
2002年から2012年までの石炭の「黄金の10年」を経験した後、「古い工業基地」である山西省太原市...