ASRU2019コンペティションが終了、中国語と英語の混合音声認識技術における新たなブレークスルー

ASRU2019コンペティションが終了、中国語と英語の混合音声認識技術における新たなブレークスルー

2019 IEEE 自動音声認識および理解ワークショップ (ASRU) は、2019 年 12 月 14 日から 18 日までシンガポールのセントーサで開催されます。東南アジアの旅行サービス大手Grab、ByteDance、Huaweiなどの国内有名企業と、人工知能データサービスプロバイダーDatatangがこのカンファレンスのプラチナスポンサーです。国内外の多くの有名テクノロジー企業や研究分野のトップエキスパートとともに、人工知能自動音声認識技術の新たな展開について議論します。


ASRU ワークショップは、IEEE 音声言語処理技術委員会 (SLTC) の主要技術イベントです。このワークショップは 2 年ごとに開催され、学界と産業界のトップ エキスパートと研究者が一堂に会し、音声認識と理解を含む音声分野の幅広い研究トピックについて詳細な議論が行われます。

周知のとおり、音声認識の分野が現在直面している大きな課題の 1 つは、多言語混合の現象です。技術的な難しさは主に、埋め込まれた言語がメイン言語の影響を強く受け、非ネイティブなアクセントを形成すること、異なる言語の音素構成の違いが混合音響モデリングに大きな困難をもたらすこと、注釈付きの混合音声トレーニング データが極めて不足していることなど、さまざまな側面で現れています。国内外の混合言語音声認識研究を推進するため、データホールは中国コンピューター学会の音声対話および聴覚専門グループ、西北工科大学のオーディオ音声および言語処理研究グループと共同で、第1回中国語・英語混合音声認識チャレンジを開催しました。このコンテストでは、中国語の音声データ500時間と、中国語と英語の混合音声データ200時間が無料で提供されました。

このコンテストは先日終了したと報じられている。コンテストには国内外から100チーム近くが参加し、音声認識技術分野で優れた研究成果を挙げている有名企業や大学も多数参加した。激しい競争の結果、トラック1の従来の音声認識 - 固定言語モデルとトラック2の従来の音声認識 - オープン言語モデルの両方のチャンピオンはMobvoiASRチームが獲得し、トラック3のエンドツーエンド音声認識グループのチャンピオンはNetEase Hangzhou Research InstituteのWYHZチームが獲得しました。

この大会の技術交流をより一層促進するため、大会運営委員会は11月23日に北京でオフライン技術交流会を開催します。会議に出席したゲストには、Mobvoiのエンジニアリング担当副社長兼MobvoiAILab責任者のHuang Meiyu氏、Baidu VoiceのチーフアーキテクトのJia Lei氏、Alibaba Machine Intelligence Technology LaboratoryのシニアアルゴリズムエンジニアのZhang Shiliang氏、西北工科大学コンピュータサイエンス学部の教授兼博士課程の指導者であり、オーディオ音声言語処理研究グループの責任者であるXie Lei氏、Datatangの共同創設者兼CEOのQi Hongwei氏が含まれていました。中国語と英語の混合音声認識と理解に関する研究に興味のあるあらゆる分野の友人の参加を歓迎します。

[[282436]]



<<:  ビッグデータに責任を負わせないでください。スモールデータをうまく活用する方が効果的かもしれません。

>>:  失業よりも悪い:人工知能の新たな進歩

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

メディア分野における人工知能の革新は期待に値する

過去 30 年間にわたり、この種のイノベーションの歴史に残る例は数多くありました。ウェブサイト上のメ...

人工知能は私たちの生活をどのように変えるのでしょうか?

人工知能は本質的に、人間の知的労働を解放するでしょう。今後、サービスがボトルネックとなり、サービス産...

...

信じられますか?これら 8 つの AI テクノロジーにより、すでに次のことが可能になっています...

人工知能(AI)は私たちが想像していたものではありません。未来だけに存在する概念で、世界を変えること...

リソースインベントリ: 便利な自動データサイエンスおよび機械学習ソフトウェア

[[208290]]概要: この記事では、海外の便利な自動データ サイエンスおよび機械学習ソフトウェ...

...

アルパカたちはどこまで来たのでしょうか?研究によると、最高のものはGPT-4のパフォーマンスの68%を達成できる。

大規模言語モデルは最近、かつてないほどの注目を集めています。急速に変化する環境において、オープンソー...

機械学習 = 「新しいボトルに入った古いワイン」の統計?いいえ!

最近、ディープラーニングと人工知能に関するジョークがソーシャルメディア上で広く流布しており、この2つ...

スマートヘルスケアの 6 つの主要な応用分野は何ですか?

スマートヘルスケアで使われる主なAI技術は画像とデータ分析機能ですが、その応用範囲は次の6つを含めて...

...

サポートベクターマシンを使用して非線形データセットを学習する方法

サポートベクターマシン (SVM) [[326874]]サポート ベクター マシンとは何ですか? サ...

...

...

グッドホープ・リンユンは並外れた知恵とビジョンを持っています丨2021グッドホープ・パートナーサミットが桂林で開催されました

2021年9月9日、「大空に舞い上がる希望、素晴らしいビジョンを持つ」2021年グッドホープパートナ...