ASRU2019コンペティションが終了、中国語と英語の混合音声認識技術における新たなブレークスルー

ASRU2019コンペティションが終了、中国語と英語の混合音声認識技術における新たなブレークスルー

2019 IEEE 自動音声認識および理解ワークショップ (ASRU) は、2019 年 12 月 14 日から 18 日までシンガポールのセントーサで開催されます。東南アジアの旅行サービス大手Grab、ByteDance、Huaweiなどの国内有名企業と、人工知能データサービスプロバイダーDatatangがこのカンファレンスのプラチナスポンサーです。国内外の多くの有名テクノロジー企業や研究分野のトップエキスパートとともに、人工知能自動音声認識技術の新たな展開について議論します。


ASRU ワークショップは、IEEE 音声言語処理技術委員会 (SLTC) の主要技術イベントです。このワークショップは 2 年ごとに開催され、学界と産業界のトップ エキスパートと研究者が一堂に会し、音声認識と理解を含む音声分野の幅広い研究トピックについて詳細な議論が行われます。

周知のとおり、音声認識の分野が現在直面している大きな課題の 1 つは、多言語混合の現象です。技術的な難しさは主に、埋め込まれた言語がメイン言語の影響を強く受け、非ネイティブなアクセントを形成すること、異なる言語の音素構成の違いが混合音響モデリングに大きな困難をもたらすこと、注釈付きの混合音声トレーニング データが極めて不足していることなど、さまざまな側面で現れています。国内外の混合言語音声認識研究を推進するため、データホールは中国コンピューター学会の音声対話および聴覚専門グループ、西北工科大学のオーディオ音声および言語処理研究グループと共同で、第1回中国語・英語混合音声認識チャレンジを開催しました。このコンテストでは、中国語の音声データ500時間と、中国語と英語の混合音声データ200時間が無料で提供されました。

このコンテストは先日終了したと報じられている。コンテストには国内外から100チーム近くが参加し、音声認識技術分野で優れた研究成果を挙げている有名企業や大学も多数参加した。激しい競争の結果、トラック1の従来の音声認識 - 固定言語モデルとトラック2の従来の音声認識 - オープン言語モデルの両方のチャンピオンはMobvoiASRチームが獲得し、トラック3のエンドツーエンド音声認識グループのチャンピオンはNetEase Hangzhou Research InstituteのWYHZチームが獲得しました。

この大会の技術交流をより一層促進するため、大会運営委員会は11月23日に北京でオフライン技術交流会を開催します。会議に出席したゲストには、Mobvoiのエンジニアリング担当副社長兼MobvoiAILab責任者のHuang Meiyu氏、Baidu VoiceのチーフアーキテクトのJia Lei氏、Alibaba Machine Intelligence Technology LaboratoryのシニアアルゴリズムエンジニアのZhang Shiliang氏、西北工科大学コンピュータサイエンス学部の教授兼博士課程の指導者であり、オーディオ音声言語処理研究グループの責任者であるXie Lei氏、Datatangの共同創設者兼CEOのQi Hongwei氏が含まれていました。中国語と英語の混合音声認識と理解に関する研究に興味のあるあらゆる分野の友人の参加を歓迎します。

[[282436]]



<<:  ビッグデータに責任を負わせないでください。スモールデータをうまく活用する方が効果的かもしれません。

>>:  失業よりも悪い:人工知能の新たな進歩

ブログ    
ブログ    

推薦する

建設業界におけるドローン

建設業界へのドローンの導入は、高度な建設手順を合理化することで業界に大きな変化をもたらしました。建設...

...

5 つの人工知能プログラミング言語! Javaはまだ立ち上がっています!

新しい AI プロジェクトに取り組んでいて、プログラミングに使用する言語をまだ決めていない場合は、今...

Nvidia テルアビブ AI サミットが中止に!黄氏の社内メールが明らかに:Nvidiaの従業員も誘拐された

少し前、25歳の中国系イスラエル人少女、ノア・アルガマニの誘拐事件がネットユーザーの間で白熱した議論...

...

深い知識の 6 つの次元: 人工知能に世界を真に理解させるにはどうすればよいでしょうか?

どのような知識が私たちを賢くするのでしょうか?私たちが世界を理解し、新しい経験を解釈し、思慮深い選択...

企業が募集している最も需要の高いAI関連職種トップ11

生成 AI は、ほぼすべての業界で急速に導入され、ビジネス界の状況を急速に変えつつあります。企業は、...

Meta AI が Omnivore をリリース: 画像、動画、3D データの分類タスクを処理できるモデル

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

エッジAIがスマートホームの未来である理由

今日では、エッジに接続されるデバイスがますます増えています。さらに良いことに、人工知能と機械学習のお...

ソフトウェア開発プロセスの近代化における生成AIの役割

近年、ソフトウェア エンジニアリングでは、自動化の強化と開発プロセスの合理化に向けて大きな変化が見ら...

2020 年に最も注目される人工知能 (AI) アプリケーション トップ 10

人工知能または機械知能は、学習アルゴリズムを通じて人間のような知能をシミュレートします。今日、人工知...

畳み込みニューラルネットワークに基づく画像分類アルゴリズム

翻訳者 | 朱 仙中校正:孫淑娟1. 畳み込みニューラル ネットワーク (CNN) とは何ですか?一...

道路が車両を制御することが自動運転の新たな方向性となるのでしょうか?

自動運転技術は、人工知能、ビジュアルコンピューティング、レーダー、監視デバイス、全地球測位システムを...

5G + AI はカスタマー サービス業界にどのような大きな影響を与えるでしょうか?

最近、工業情報化部は通信事業者4社に5G商用ライセンスを発行し、5G商用時代の到来を告げた。 AIと...