ASRU2019コンペティションが終了、中国語と英語の混合音声認識技術における新たなブレークスルー

ASRU2019コンペティションが終了、中国語と英語の混合音声認識技術における新たなブレークスルー

2019 IEEE 自動音声認識および理解ワークショップ (ASRU) は、2019 年 12 月 14 日から 18 日までシンガポールのセントーサで開催されます。東南アジアの旅行サービス大手Grab、ByteDance、Huaweiなどの国内有名企業と、人工知能データサービスプロバイダーDatatangがこのカンファレンスのプラチナスポンサーです。国内外の多くの有名テクノロジー企業や研究分野のトップエキスパートとともに、人工知能自動音声認識技術の新たな展開について議論します。


ASRU ワークショップは、IEEE 音声言語処理技術委員会 (SLTC) の主要技術イベントです。このワークショップは 2 年ごとに開催され、学界と産業界のトップ エキスパートと研究者が一堂に会し、音声認識と理解を含む音声分野の幅広い研究トピックについて詳細な議論が行われます。

周知のとおり、音声認識の分野が現在直面している大きな課題の 1 つは、多言語混合の現象です。技術的な難しさは主に、埋め込まれた言語がメイン言語の影響を強く受け、非ネイティブなアクセントを形成すること、異なる言語の音素構成の違いが混合音響モデリングに大きな困難をもたらすこと、注釈付きの混合音声トレーニング データが極めて不足していることなど、さまざまな側面で現れています。国内外の混合言語音声認識研究を推進するため、データホールは中国コンピューター学会の音声対話および聴覚専門グループ、西北工科大学のオーディオ音声および言語処理研究グループと共同で、第1回中国語・英語混合音声認識チャレンジを開催しました。このコンテストでは、中国語の音声データ500時間と、中国語と英語の混合音声データ200時間が無料で提供されました。

このコンテストは先日終了したと報じられている。コンテストには国内外から100チーム近くが参加し、音声認識技術分野で優れた研究成果を挙げている有名企業や大学も多数参加した。激しい競争の結果、トラック1の従来の音声認識 - 固定言語モデルとトラック2の従来の音声認識 - オープン言語モデルの両方のチャンピオンはMobvoiASRチームが獲得し、トラック3のエンドツーエンド音声認識グループのチャンピオンはNetEase Hangzhou Research InstituteのWYHZチームが獲得しました。

この大会の技術交流をより一層促進するため、大会運営委員会は11月23日に北京でオフライン技術交流会を開催します。会議に出席したゲストには、Mobvoiのエンジニアリング担当副社長兼MobvoiAILab責任者のHuang Meiyu氏、Baidu VoiceのチーフアーキテクトのJia Lei氏、Alibaba Machine Intelligence Technology LaboratoryのシニアアルゴリズムエンジニアのZhang Shiliang氏、西北工科大学コンピュータサイエンス学部の教授兼博士課程の指導者であり、オーディオ音声言語処理研究グループの責任者であるXie Lei氏、Datatangの共同創設者兼CEOのQi Hongwei氏が含まれていました。中国語と英語の混合音声認識と理解に関する研究に興味のあるあらゆる分野の友人の参加を歓迎します。

[[282436]]



<<:  ビッグデータに責任を負わせないでください。スモールデータをうまく活用する方が効果的かもしれません。

>>:  失業よりも悪い:人工知能の新たな進歩

ブログ    

推薦する

AIが開発ツールを進化させる方法

[[410767]] GitHub Copilot、DeepDev、IntelliCode、その他の...

脳に埋め込まれたAIチップはてんかん発作を予測し、2時間で充電して1週間持続する

脳にAIチップを埋め込むことで、てんかん発作をいつでも予測し、制御できるようになります。これは、我が...

Googleが生成AIをオンラインショッピングに適用、実在のモデルが高精度な仮想衣装着せ替えを実現

グーグルは6月15日、オンラインショッピングツールに新たな生成AI技術を導入すると発表した。この技術...

...

業界大手がIoTとAIを成功裏に導入するための3つのステップ

変化は避けられませんが、人間はそれに抵抗する傾向があります。エリザベス1世女王は、編み機の発明によっ...

これがあれば、母は私が授業をさぼったり、空想にふけったり、携帯電話で遊んだりすることを心配する必要がなくなります...

最近、中国薬科大学は試験的に教室に顔認識システムを導入しました。学生の出席を自動的に識別するだけでな...

将来展望: 2024 年の人工知能

生成型人工知能 (GenAI) ツールから AIOps の採用まで、AI の未来がどうなるかをご紹介...

Java プログラミング スキル - データ構造とアルゴリズム「プレフィックス、インフィックス、サフィックス」

[[387421]]接頭辞表現(ポーランド語表記)プレフィックス式はポーランド式とも呼ばれます。プ...

AIは教育分野で大きな可能性を秘めています。どのように活用できるでしょうか?

[[238201]]過去 10 年間、学界と AI の専門家は、AI が教育に活用できるかどうかに...

...

IBM WatsonX: AIを企業の生産性の中核に

「象は踊れるの?」もちろん踊れますよ!かつての人々の考え方では、伝統的な大企業は、組織の肥大化や閉鎖...

2020年顔認識レポート:数万社が市場に参入し、8つの主要技術と6つのトレンドがすべて1つの記事でカバーされています

[[379936]]近年、人工知能、コンピュータービジョン、ビッグデータ、クラウドコンピューティング...

2020年のIT開発トレンドは刺激的

[[274294]] [51CTO.com クイック翻訳] Future Today Researc...

人工知能のコミュニケーション:コンテキストは業界マネージャーにとって成功への道

SymphonyAI のマーケティング責任者として、私は企業における人工知能 (AI) のあらゆるア...