40の言語を同時に理解する人工知能が異言語コミュニケーションを支援

40の言語を同時に理解する人工知能が異言語コミュニケーションを支援

先日行われた世界的に権威のある多言語理解評価XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)において、ハルビン工業大学iFLYTEK合同実験室(HFL)チームが総平均スコア84.1で1位となり、世界新記録を樹立した。

[[433407]]

XTREME 評価は、モデルの多言語理解と言語間転送機能を総合的に検査することを目的としています。これまでの単一言語の自然言語理解評価タスクとは異なり、XTREME の各タスクは複数の言語をカバーし、文のペア分類、シーケンスのラベル付け、読解、文の検索トラックなど、合計 4 つのカテゴリと 9 つのタスクが含まれています。

では、機械はどのようにして多言語理解を実現するのでしょうか。コンテストの責任者でハルビン工業大学iFLYTEK共同研究室のコア技術研究者である楊子清氏は、彼らが独自に開発した言語間比較学習技術と、自己教師学習と知識移転のための知識蒸留技術を使用して、モデルが異なる言語の意味的類似性を学習するように促していると紹介しました。同時に、彼らはまた、きめ細かい言語的特徴を革新的に取り入れ、モデルが不十分なトレーニングの困難を克服し、リソースの少ない言語の不十分な学習の問題を解決し、さまざまな言語の形態的特徴に適応できるようにしています。

「これは、母国語学習を通じて、機械が少量の他言語コーパスとの類推によって言語を学習でき、コーパスの収集や音声注釈などの作業を大幅に削減できることを意味します」とヤン・ジチン氏は説明した。

iFLYTEK は、多言語対応に加え、少数言語処理用の事前学習済みモデル CINO (Chinese mINOrity 事前学習済み言語モデル) もリリースしました。

楊子青氏は「少数民族の言語処理は中国の情報処理に欠かせない部分であり、中国の情報処理の多様性の表れでもある。この技術の進歩はわが国の少数民族の言語学習の問題を大きく改善するだろう」と紹介した。

国内の少数民族言語コーパスの希少性と入手困難さのため、関連する技術研究は比較的少なく、主流の多言語モデルは国内の少数民族言語と文字をうまく処理できません。 「今後、業界における少数言語に関する技術研究をさらに推進し、少数言語に関する技術の応用を推進できることを期待しています。将来的には、さまざまな少数言語をサポートする多言語検索エンジンなどのテキストアプリケーションツールが可能になるかもしれません」と楊子青氏は語った。

<<:  Facebook は顔認識を中止することで本当にリスクを回避しているのでしょうか?人種差別は致命的である

>>:  人工知能が「人工知能」にならないようにするための鍵は、まだ人間の脳にあるかもしれない

ブログ    
ブログ    

推薦する

学問に戻りましょう!シュム氏は清華大学の非常勤教授として、コンピュータビジョンとグラフィックスの博士課程の学生を募集する。

[[317132]]出典:中国ビジネスニュースマイクロソフトの元副社長、ハリー・シャム博士が学界復...

「疑似人工知能」が飛び交う。スマートホームで実現できるのか?

AlphaGo から Master まで、人工知能 (AI) は再びテクノロジー界の最前線に押し上...

ニューラル ネットワークの父、ヒントン氏の最新の演説: デジタル インテリジェンスは生物学的インテリジェンスに取って代わるでしょうか?

「人工知能のゴッドファーザー」として知られるジェフリー・ヒントン教授は、英国王立協会 (FRS) ...

AIを活用してパイロットプロジェクトを計画する方法

人工知能 (AI) は、あらゆる業界の企業にビジネス運営の成長と改善の機会を提供します。 Fortu...

...

顔認識はあなたの家の玄関からどれくらい離れていますか?

最近、Google Chinaは新たなPR活動を開始した。そのひとつは、Zhihuで「AIが私たちの...

中山大学が偏りのない視覚的質問応答データセットを公開、その論文はトップジャーナルTNNLSに掲載される

最近、中山大学は常識に基づいた偏りのない視覚的質問応答データセット (Knowledge-Route...

あなたたちは AI を大々的に宣伝していますが、AI はまだ 4 歳児ほど賢くありません。

研究によると、人工知能は強力に聞こえますが、現在の高度な人工知能は、人間の 4 歳児が簡単に解決でき...

ChatGPTのサプライチェーンへの応用の可能性

IT ソリューション プロバイダーの Manhattan Associates のマネージング ディ...

openKylinオペレーティングシステムが正式に発表され、ビッグモデルに接続し、音声アシスタントとデスクトッププラグインを提供します

9月21日、openKylinオペレーティングシステムは今晩、ビッグモデルへのアクセスを正式に発表し...

...

...

生成型人工知能(GenAI)は将来のテクノロジーの展望を一変させる

ChatGPT の人気が高まるにつれ、生成型人工知能 (GenAI) がテクノロジー業界の未来を大き...

マイクロソフト、警察への顔認識サポート提供を禁止される企業リストに加わる

マイクロソフトはIBMとアマゾンに続き、米警察への顔認識ソフトウェアの販売を停止した最新のテクノロジ...

OpenAIは静かにその中核となる価値観を改訂し、汎用人工知能の構築に注力する

10月16日、OpenAIはひっそりと「コアバリュー」のリストを変更し、これまで明示的に挙げられてい...