ASRU2019コンペティションが終了、中国語と英語の混合音声認識技術における新たなブレークスルー

ASRU2019コンペティションが終了、中国語と英語の混合音声認識技術における新たなブレークスルー

2019 IEEE 自動音声認識および理解ワークショップ (ASRU) は、2019 年 12 月 14 日から 18 日までシンガポールのセントーサで開催されます。東南アジアの旅行サービス大手Grab、ByteDance、Huaweiなどの国内有名企業と、人工知能データサービスプロバイダーDatatangがこのカンファレンスのプラチナスポンサーです。国内外の多くの有名テクノロジー企業や研究分野のトップエキスパートとともに、人工知能自動音声認識技術の新たな展開について議論します。


ASRU ワークショップは、IEEE 音声言語処理技術委員会 (SLTC) の主要技術イベントです。このワークショップは 2 年ごとに開催され、学界と産業界のトップ エキスパートと研究者が一堂に会し、音声認識と理解を含む音声分野の幅広い研究トピックについて詳細な議論が行われます。

周知のとおり、音声認識の分野が現在直面している大きな課題の 1 つは、多言語混合の現象です。技術的な難しさは主に、埋め込まれた言語がメイン言語の影響を強く受け、非ネイティブなアクセントを形成すること、異なる言語の音素構成の違いが混合音響モデリングに大きな困難をもたらすこと、注釈付きの混合音声トレーニング データが極めて不足していることなど、さまざまな側面で現れています。国内外の混合言語音声認識研究を推進するため、データホールは中国コンピューター学会の音声対話および聴覚専門グループ、西北工科大学のオーディオ音声および言語処理研究グループと共同で、第1回中国語・英語混合音声認識チャレンジを開催しました。このコンテストでは、中国語の音声データ500時間と、中国語と英語の混合音声データ200時間が無料で提供されました。

このコンテストは先日終了したと報じられている。コンテストには国内外から100チーム近くが参加し、音声認識技術分野で優れた研究成果を挙げている有名企業や大学も多数参加した。激しい競争の結果、トラック1の従来の音声認識 - 固定言語モデルとトラック2の従来の音声認識 - オープン言語モデルの両方のチャンピオンはMobvoiASRチームが獲得し、トラック3のエンドツーエンド音声認識グループのチャンピオンはNetEase Hangzhou Research InstituteのWYHZチームが獲得しました。

この大会の技術交流をより一層促進するため、大会運営委員会は11月23日に北京でオフライン技術交流会を開催します。会議に出席したゲストには、Mobvoiのエンジニアリング担当副社長兼MobvoiAILab責任者のHuang Meiyu氏、Baidu VoiceのチーフアーキテクトのJia Lei氏、Alibaba Machine Intelligence Technology LaboratoryのシニアアルゴリズムエンジニアのZhang Shiliang氏、西北工科大学コンピュータサイエンス学部の教授兼博士課程の指導者であり、オーディオ音声言語処理研究グループの責任者であるXie Lei氏、Datatangの共同創設者兼CEOのQi Hongwei氏が含まれていました。中国語と英語の混合音声認識と理解に関する研究に興味のあるあらゆる分野の友人の参加を歓迎します。

[[282436]]



<<:  ビッグデータに責任を負わせないでください。スモールデータをうまく活用する方が効果的かもしれません。

>>:  失業よりも悪い:人工知能の新たな進歩

ブログ    
ブログ    
ブログ    

推薦する

Googleを超えろ!世界最大の時間結晶が記録を破り、量子コンピューターが新たな奇跡を起こす

今日、タイムクリスタルは再び新しいスターを迎え、Sceinceサブマガジンに登場しました。 タイムク...

ニューロンクラスタリングはAIの学習戦略をシミュレートできる

人間や機械がタスクをよりうまく実行できるようになるたびに、証拠の痕跡が残ります。パフォーマンス向上の...

データマイニングの分野でトップ 10 の古典的なアルゴリズムの 1 つ - K-Means アルゴリズム (コード付きで非常に詳細)

k-means アルゴリズムは比較的単純です。 k-means アルゴリズムでは、クラスターはクラ...

Patronus AI が LLM に懸念すべきセキュリティ上の欠陥を発見

自動評価および安全性プラットフォームである Patronus AI は、大規模言語モデル (LLM)...

ロボットが医療に力を与える!しかし、医療ロボットがブレイクするまでには、まだ4歩の道のりがある。

今回の流行期間中、病院や最前線の防疫現場では、体温測定ロボット、消毒ロボット、検査ロボット、咽頭ぬぐ...

複合現実技術による医療シナリオ、Weizhuo Zhiyuan は 3D シーンを使用して病変を正確に特定します

[51CTO.comからの原文] 今日の医療業界は、次第にテクノロジー化と精密化が進んでいます。医療...

...

AI列車に乗ってみよう!マーケティングに人工知能を活用する3つの方法

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

トレンドにおける危険とチャンス: 生成 AI の黄金期をどう捉えるか?

ChatGPTは今年9月末に音声チャットと画像認識機能を追加しました。テキスト駆動型と比較して、C...

150 ページの「幾何学的ディープラーニング」がオンラインになりました: 対称性と不変性を利用して機械学習の問題を解決する

過去 10 年間、データ サイエンスと機械学習の分野では驚異的な進歩が見られました。ディープラーニン...

ハイエンドチップはインテリジェント運転の問題を解決できるでしょうか?

この数か月の「影響」を経て、誰もが半導体不足の事実を十分に認識したと思います。2020年12月以来、...

...

DeepMindの論文がNatureに掲載されました。大規模なモデルが、数学者を何十年も悩ませてきた問題に新たな解決策を発見しました。

今年の AI 界のトップトレンドである大規模言語モデル (LLM) は概念を組み合わせるのが得意で、...

従来の不正検出ソリューションは機能していません。中小企業はどのようにして不正を防止できるでしょうか?

[51CTO.com からのオリジナル記事] モバイル インターネットの発展の初期から現在に至るま...

AI を活用した検索と推奨はどれほど強力でしょうか?

著者 | ユン・チャオユーザーと情報の間には、検索か推奨のいずれかが存在します。百度の執行副社長であ...