40の言語を同時に理解する人工知能が異言語コミュニケーションを支援

40の言語を同時に理解する人工知能が異言語コミュニケーションを支援

先日行われた世界的に権威のある多言語理解評価XTREME(Cross-Lingual Transfer Evaluation of Multilingual Encoders)において、ハルビン工業大学iFLYTEK合同実験室(HFL)チームが総平均スコア84.1で1位となり、世界新記録を樹立した。

[[433407]]

XTREME 評価は、モデルの多言語理解と言語間転送機能を総合的に検査することを目的としています。これまでの単一言語の自然言語理解評価タスクとは異なり、XTREME の各タスクは複数の言語をカバーし、文のペア分類、シーケンスのラベル付け、読解、文の検索トラックなど、合計 4 つのカテゴリと 9 つのタスクが含まれています。

では、機械はどのようにして多言語理解を実現するのでしょうか。コンテストの責任者でハルビン工業大学iFLYTEK共同研究室のコア技術研究者である楊子清氏は、彼らが独自に開発した言語間比較学習技術と、自己教師学習と知識移転のための知識蒸留技術を使用して、モデルが異なる言語の意味的類似性を学習するように促していると紹介しました。同時に、彼らはまた、きめ細かい言語的特徴を革新的に取り入れ、モデルが不十分なトレーニングの困難を克服し、リソースの少ない言語の不十分な学習の問題を解決し、さまざまな言語の形態的特徴に適応できるようにしています。

「これは、母国語学習を通じて、機械が少量の他言語コーパスとの類推によって言語を学習でき、コーパスの収集や音声注釈などの作業を大幅に削減できることを意味します」とヤン・ジチン氏は説明した。

iFLYTEK は、多言語対応に加え、少数言語処理用の事前学習済みモデル CINO (Chinese mINOrity 事前学習済み言語モデル) もリリースしました。

楊子青氏は「少数民族の言語処理は中国の情報処理に欠かせない部分であり、中国の情報処理の多様性の表れでもある。この技術の進歩はわが国の少数民族の言語学習の問題を大きく改善するだろう」と紹介した。

国内の少数民族言語コーパスの希少性と入手困難さのため、関連する技術研究は比較的少なく、主流の多言語モデルは国内の少数民族言語と文字をうまく処理できません。 「今後、業界における少数言語に関する技術研究をさらに推進し、少数言語に関する技術の応用を推進できることを期待しています。将来的には、さまざまな少数言語をサポートする多言語検索エンジンなどのテキストアプリケーションツールが可能になるかもしれません」と楊子青氏は語った。

<<:  Facebook は顔認識を中止することで本当にリスクを回避しているのでしょうか?人種差別は致命的である

>>:  人工知能が「人工知能」にならないようにするための鍵は、まだ人間の脳にあるかもしれない

ブログ    
ブログ    

推薦する

プログラマーを夢中にさせるソートアルゴリズムに関するビデオ

ルーマニア人はダンスが大好きな国民です。古いルーマニア映画「チプリアン・ボロンベスク」をご覧になった...

RSAは過去2世紀で最も重要なアルゴリズムの1つです

Diffie-Hellman暗号化アルゴリズムの欠点[[225219]]前回の記事では、Diffie...

上位985大学の「人工知能」関連学部・専攻一覧!ぜひ集めてみてください!

今最もホットな分野といえば、間違いなく「人工知能」でしょう。給与面でも人材ギャップの面でも、この分野...

顧客の声: AI はあなたにとって優先事項ですか? データ戦略から始める必要があります

[[337768]]現在、世界中のあらゆる部門が人工知能(AI)の研究を行っています。 AI の画...

CCTV 3.15は顔認識の悪用を暴露し、多くの教育企業が同様のカメラを使用する可能性がある

CCTV スクリーンショット街面の李婷が報告顔認識の応用シナリオはますます多様化しており、その背後...

現代の製造業におけるマシンビジョンと人工知能の重要な役割

競争が激化し規制が厳しくなる環境において、マシン ビジョン (MV) ソリューションは製造業者にとっ...

プログラマーから見たChatGPT

著者 |ブライト・リャオ私はもともとAI技術に興味があったソフトウェア開発エンジニアで、ディープラー...

機械学習を簡単にする 5 つのオープンソース Python ライブラリ

機械学習は興味深いものですが、実際に実行するのは難しく複雑です。ワークフローとパイプラインの組み立て...

...

機械学習トランスフォーマーアーキテクチャの謎を解く

翻訳者|朱 仙中レビュー | Chonglou Transformers は 2017 年の発売以来...

IBMは人工知能にアナログコンピューティングを使用し、AIコンピューティングを改革する

IBM は人工知能コンピューティングを改革する方法に取り組んでいます。 IBM の研究者は、人工知能...

サイエンス誌の表紙を飾ったCMUの偉人ノアムは博士号を取得し、その論文が公開された。

2 人用ノーリミット ポーカーとマルチプレイヤー ノーリミット ポーカーでトップの人間プレイヤーに...

ディープラーニングとデータセンターの関係

ディープラーニングは、教師なし特徴学習または特徴学習とも呼ばれ、人工知能の研究分野の 1 つであり、...

アディダスのロボット工場で作られた靴が出荷されようとしている

アディダスがドイツに開設したロボット靴製造工場「スピードファクトリー」が正式に生産を開始したと報じら...