テンセントAIが新たな記録を樹立:ACL 2020に27本の論文が選出

テンセントAIが新たな記録を樹立:ACL 2020に27本の論文が選出

最近、計算言語学会(ACL)は公式ウェブサイトでACL 2020の採択論文リストを発表し、合計779件の論文が含まれていました。不完全な統計によると、今回テンセントから合計27本の論文が選ばれ、選ばれた論文の総数で国内記録を更新し、国内AI研究の第一線をリードした。

今年の Tencent ACL に選ばれた論文のうち、20 件は Tencent AI Lab チームによるもので、7 件は WeChat AI チームによるものです。研究の方向性は、対話とテキスト生成、機械翻訳とテキスト理解、情報抽出、教師なしテキストなど、複数の主要な NLP 領域をカバーしています。

テンセントは過去1年間、オープンソースの連携を通じて、各事業グループの最も基本的かつ共通的な技術力を整理・統合し、基礎的な研究開発投資を強化し、研究開発の効率と技術資源の活用効率をさらに向上させ、AI技術の研究開発とイノベーションに活力のある土壌を提供してきました。

ACL は自然言語処理の分野における最高峰の国際学術会議であり、自然言語処理の分野において最も影響力があり、活発な国際学術組織の 1 つです。論文が採択されるということは、研究成果が国際学術コミュニティによって認められたことを意味します。 ACL 2020の審査サイクルは、前年に比べてほぼ2倍になりました。最新の公開データによると、この会議には最終的に3,088件の投稿が寄せられ、投稿数の過去最高を記録しました。


基礎AI研究における強力な技術力と卓越した優位性

近年、テンセントは基礎的なAI研究への投資を継続し、未来志向のテクノロジーエンジンの構築に取り組んでいます。テンセントAIチームは、ACL 2019で中国初の最優秀長編論文に選ばれ、ICML、CVPR、NeurIPS、ACLなどのトップ学術会議やジャーナルに285本以上の論文が選ばれ、DSTC 8などの複数のコンテストで優勝するなど、業界をリードする研究力と技術力を実証しています。

自然言語処理は、テンセント AI ラボの重要な研究方向の 1 つであり、研究内容は自然言語の理解から生成までの全チェーンを網羅しています。 2019年、テンセントAIラボは、人間とコンピュータの対話やテキスト生成の分野でさまざまな新しい対話生成フレームワークを提案し、複数の対話データセットをリリースし、オープンドメイン対話システムを改善しました。機械翻訳研究の面では、テンセントAIラボは主流の翻訳モデルにおける自己注意モデルと段落翻訳の改善を模索し、ニューラルネットワーク翻訳モデルのブラックボックスを開いて核心問題の動作メカニズムの解明を試みた。

WeChat AIチームは長年にわたり、自然言語処理の分野で人工知能技術の研究開発に深く関わっており、WeChat ZhiyanやWeChat Zhilingなど、最先端のNLP技術製品を持っています。ACL 2020に選ばれた7つの論文は、機械翻訳、対話システム、情報抽出、教師なしテキスト生成などの分野をカバーしています。 2019年、WeChat AIチームはNumNet+モデルでGoogleを上回り、DROP読解力ランキングで1位を獲得しました。

豊富なアプリケーションシナリオと業界向けのオープンな技術力

一流の製品は一流の技術に基づいています。テンセントの豊富なビジネスシナリオと巨大なユーザーベースは、最先端の AI 研究成果のための最高の「トレーニングの場」を提供します。これを基に、テンセントは、テンセントクラウドを通じて、金融、政府関係、医療、交通、教育などさまざまな業界に、磨き抜かれた技術力を製品やサービスの形で開放し、多くの顧客やパートナーに基礎的な技術サポートを提供し、産業インターネットの高速化に貢献します。

現在、WeChat AIチームは、音声とセマンティクスにそれぞれ重点を置いた「WeChat Intelligent Listening」と「WeChat Intelligent Speech」という2つの主要な技術機能ブランドを立ち上げました。 WeChat インテリジェントリスニングは、認識精度 97% で毎日 4 億件以上の音声メッセージを処理し、テンセント内外の 100 社以上の企業にサービスを提供しています。 WeChat Zhiyan はインテリジェントな会話と自然言語処理に重点を置いており、現在は家庭用ハードウェア、PaaS、産業用クラウド、AI ボットなどのアプリケーション領域をサポートしています。

WeChat AIチームは、製品機能にも継続的に技術の進歩を適用し、音声入力によるテキスト入力、コード/カバーのスキャンと翻訳、チャットボット、シェイクミュージック/TV、声紋ロックなどの機能を開発し、Honor of KingsやQQ Musicなどの製品に技術サポートを提供しています。

2020年初頭のWeChat Open Class PROバージョンで、WeChat AIはハードウェア協力を中心とするテンセント小衛ハードウェアオープンプラットフォーム、対話オープン機能を中心とするWeChat対話オープンプラットフォーム、NLP基本技術プラットフォームのオープンを発表し、あらゆるレベルでNLP機能を全面的にオープンし、WeChatの最先端のNLP研究成果を業界ユーザーと開発者に公開しました。

Tencent AI Labは、業界をリードする人間とコンピューターのインタラクティブな機械翻訳技術を使用して、ユーザーが翻訳タスクをより良く、より速く完了できるように支援するTranSmart製品を2018年11月にリリースしました。

今年4月には、テンセントAIラボが開発した自然言語理解システム「TexSmart」も一般公開され、きめ細かい固有表現認識、意味的関連付け、深い意味表現などの特殊機能を提供している。 TexSmart は、テンセントの企業レベルのテキスト処理ツールの強化版であり、1 日の呼び出し回数が数千億回に達する、テンセントの自然言語処理に関連する事業および製品を幅広くサポートします。

テンセントは自社の製品や技術力をオープンにするだけでなく、オープンソースを通じて開発者とコードを共有することにも力を入れています。オープンソース プロジェクトの総数は現在 100 件を超えています。

AI分野だけでも、テンセントはAngelやNCNNなど数十の高品質プロジェクトをオープンソース化しています。業界における中国語単語ベクトルに関する既存の公開データの不足と不十分さに対応するため、テンセントAIラボは、800万以上の中国語単語を含む大規模で高品質の中国語単語ベクトルデータをオープンソース化しました。既存の公開データと比較して、カバレッジ、鮮度、精度が大幅に向上し、対話応答品質予測や医療エンティティ認識などの自然言語処理のビジネスアプリケーションに大幅なパフォーマンス向上をもたらしました。

<<:  サイバーセキュリティにおける機械学習の適用における困難さと対策

>>:  フェイスブック従業員の半数が10年以内にリモート勤務、転勤、給与削減へ、ザッカーバーグは二級都市、三級都市で大量採用

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

大型モデル選択ガイドがここにあります! 6つのシナリオをカバーし、最適なモデルをマッチング

最近、Claude 2 が発表され、Google Bard が中国語をサポートし、Open AI が...

Go言語で遺伝的アルゴリズムを実装する方法

ただの楽しみのために、Go 言語を学ぶことにしました。新しい言語を学ぶ最良の方法は、深く学び、できる...

...

...

チューリング賞受賞者たちは口論。ルカン氏:ベンジオ氏、ヒントン氏らのAI絶滅理論はばかげている

AIのリスクの問題に関しては、さまざまな有力者がさまざまな意見を持っています。 AI研究室に研究を即...

AIトレーニングの裏話を公開:専門家だけでなく、世界中の無数のオフィスワーカーもAIの進化に貢献している

要点: AI システムが学習する前に、入力されたデータにラベルを付ける作業が必要です。これは、自動運...

...

衝突の火花: ディープ AI とワイヤレス センシング (パート 1)

[[435758]]序文モノのインターネット (IoT) の発展により、さまざまな無線信号 (Wi...

...

Python は R を抜いて、データ サイエンスと機械学習プラットフォームで最も人気のある言語になるのでしょうか?

最近、kdnuggets はデータ サイエンスと機械学習言語の使用に関するアンケート調査を実施しまし...

...

AIがプログラマーの仕事を奪う:2040年にはAIがプログラマーに取って代わる可能性

米国のオークリッジ国立研究所の一部専門家は、2040年までにAI技術がプログラマーに取って代わるほど...

ソフトウェアと自動化機器が持続可能性と回復力を向上させる方法

近年、需要の増加、エネルギーコストの高騰、持続可能性の問題が続く中、データセンターが注目を集めていま...

...

プログラマーの間でデータ構造やアルゴリズムに関する知識が一般的に不足していることについてどう思いますか?

多くのプログラマーの目には、データ構造やアルゴリズムなどは役に立たず、実際に使用されることもあまりな...