ASRU2019コンペティションが終了、中国語と英語の混合音声認識技術における新たなブレークスルー

ASRU2019コンペティションが終了、中国語と英語の混合音声認識技術における新たなブレークスルー

2019 IEEE 自動音声認識および理解ワークショップ (ASRU) は、2019 年 12 月 14 日から 18 日までシンガポールのセントーサで開催されます。東南アジアの旅行サービス大手Grab、ByteDance、Huaweiなどの国内有名企業と、人工知能データサービスプロバイダーDatatangがこのカンファレンスのプラチナスポンサーです。国内外の多くの有名テクノロジー企業や研究分野のトップエキスパートとともに、人工知能自動音声認識技術の新たな展開について議論します。


ASRU ワークショップは、IEEE 音声言語処理技術委員会 (SLTC) の主要技術イベントです。このワークショップは 2 年ごとに開催され、学界と産業界のトップ エキスパートと研究者が一堂に会し、音声認識と理解を含む音声分野の幅広い研究トピックについて詳細な議論が行われます。

周知のとおり、音声認識の分野が現在直面している大きな課題の 1 つは、多言語混合の現象です。技術的な難しさは主に、埋め込まれた言語がメイン言語の影響を強く受け、非ネイティブなアクセントを形成すること、異なる言語の音素構成の違いが混合音響モデリングに大きな困難をもたらすこと、注釈付きの混合音声トレーニング データが極めて不足していることなど、さまざまな側面で現れています。国内外の混合言語音声認識研究を推進するため、データホールは中国コンピューター学会の音声対話および聴覚専門グループ、西北工科大学のオーディオ音声および言語処理研究グループと共同で、第1回中国語・英語混合音声認識チャレンジを開催しました。このコンテストでは、中国語の音声データ500時間と、中国語と英語の混合音声データ200時間が無料で提供されました。

このコンテストは先日終了したと報じられている。コンテストには国内外から100チーム近くが参加し、音声認識技術分野で優れた研究成果を挙げている有名企業や大学も多数参加した。激しい競争の結果、トラック1の従来の音声認識 - 固定言語モデルとトラック2の従来の音声認識 - オープン言語モデルの両方のチャンピオンはMobvoiASRチームが獲得し、トラック3のエンドツーエンド音声認識グループのチャンピオンはNetEase Hangzhou Research InstituteのWYHZチームが獲得しました。

この大会の技術交流をより一層促進するため、大会運営委員会は11月23日に北京でオフライン技術交流会を開催します。会議に出席したゲストには、Mobvoiのエンジニアリング担当副社長兼MobvoiAILab責任者のHuang Meiyu氏、Baidu VoiceのチーフアーキテクトのJia Lei氏、Alibaba Machine Intelligence Technology LaboratoryのシニアアルゴリズムエンジニアのZhang Shiliang氏、西北工科大学コンピュータサイエンス学部の教授兼博士課程の指導者であり、オーディオ音声言語処理研究グループの責任者であるXie Lei氏、Datatangの共同創設者兼CEOのQi Hongwei氏が含まれていました。中国語と英語の混合音声認識と理解に関する研究に興味のあるあらゆる分野の友人の参加を歓迎します。

[[282436]]



<<:  ビッグデータに責任を負わせないでください。スモールデータをうまく活用する方が効果的かもしれません。

>>:  失業よりも悪い:人工知能の新たな進歩

ブログ    
ブログ    
ブログ    

推薦する

スーパー人工知能とは何ですか?

進化し続けるテクノロジーの世界において、魅力的であると同時に不安も抱かせる概念の出現が、スーパー人工...

LangChain と Redis が協力して何かを実現しています!財務文書分析の精度を向上させるツールを作成する

著者 | タニスタ編纂者:Xing Xuan制作:51CTO テクノロジースタック(WeChat I...

注意メカニズムにバグがあり、ソフトマックスが犯人であり、すべてのトランスフォーマーに影響を与えている

「私は、8年間誰も発見できなかった注目度の式のバグを発見しました。GPTやLLaMAを含むすべてのT...

Metaは、パラメータを積み重ねたり、トレーニング時間に依存したりすることなくViTトレーニングプロセスを加速し、スループットを4倍に増加させます。

現在、ビジュアルトランスフォーマー(ViT)モデルは、画像分類、オブジェクト検出、セグメンテーション...

...

AIと情報サービスが出会うとき:百度脳産業イノベーションフォーラムが成都であなたを待っています

注目の人工知能がインターネットの「伝統的なプロジェクト」情報サービスと出会うと、業界にどのような A...

AI による顔を変える動画が何百万人ものユーザーを獲得。たった 1 ステップで楽しさから恐怖感まで

今朝、私の友人の輪の中に、AI による顔の変形に関する短い動画が大量に現れました。これらの短編動画の...

ソフトマックスボトルネックを超えて: 高ランク RNN 言語モデル

因数分解に基づいて、リカレントニューラルネットワーク (RNN) に基づく言語モデルは、複数のベンチ...

...

...

独自のデータを使ってシンプルな畳み込みニューラルネットワークを構築する

この記事では、花、車、猫、馬、人、自転車、犬の 7 種類の何千もの画像でトレーニングされ、特定の画像...

浙江大学がSFロボットの群れを作り上げました!自主的に考え、自律的に移動してターゲットを追跡できる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

避けられないアルゴリズムを完全に理解するにはどうすればよいでしょうか?

検索エンジン(Google Chrome、Mozilla Firefox など)を使用するとき、バッ...

AI著作権問題プラットフォームが有料化、Googleは将来的にGoogle Cloud向けに開始予定の「免責保護」サービスを紹介

グーグルは10月16日、今月13日に自社の生成AI製品のユーザーが当局によって保護されると発表した。...