Microsoft Translator は 100 を突破し、チベット語、ウイグル語など 12 の新しい言語/方言のサポートを追加しました...

Microsoft Translator は 100 を突破し、チベット語、ウイグル語など 12 の新しい言語/方言のサポートを追加しました...

IT Homeは10月12日、Microsoft Translatorが本日、12の新しい言語と方言をサポートすると発表したと報じた。このサポートにより、Microsoft Translator は現在合計 103 の言語をサポートし、世界人口の 72% をカバーしています。このリリースにより、Microsoft Translator はテキストやドキュメントを世界中の 56 億 6 千万人の母国語に翻訳できるようになります。

IT Home は、Microsoft Translator に新しく追加された言語が、バシキール語、ディベヒ語、グルジア語、キルギス語、マケドニア語、モンゴル語 (キリル文字)、モンゴル語 (繁体字版)、タタール語、チベット語、トルクメン語、ウイグル語、ウズベク語 (ラテン文字) であることを知りました。これらの新しい言語を話す人は8,460万人です。

「100 の言語は、あらゆる人がどんな言語を話す人でもコミュニケーションできるようにするという私たちの目標の達成に向けた大きなマイルストーンです」と、マイクロソフトのテクニカル フェロー兼 Azure AI CTO である Xuedong Huang 氏は述べています。

Microsoft Translatorの進化

Microsoft Research は 20 年以上前に初めて機械翻訳システムを開発しました。 2003 年、機械翻訳システムにより、Microsoft Knowledge Base 全体が英語からスペイン語、フランス語、ドイツ語、日本語に翻訳され、その翻訳が Web サイトで公開されました。これは、当時インターネット上で最大規模の公開型機械翻訳アプリケーションとなりました。

Microsoft は、統計的機械翻訳 (SMT) モデルに基づいてこれらのシステムをさらに開発し、Windows Live Translator、Translator API、および Microsoft Office アプリケーションの組み込み機能を通じて一般に公開しました。

マイクロソフトは、長年にわたり、世界で最も一般的に使用されている言語の多くに翻訳システムを追加してきたと述べた。マイクロソフトは、人工知能 (AI) 技術の発展に伴い、ニューラル機械翻訳 (NMT) 技術を採用し、すべての機械翻訳システムを Transformer 技術に基づくニューラル モデルに移行し、翻訳の流暢性と正確性の大幅な向上を実現しました。

NMT テクノロジーによって翻訳全体の品質が大幅に向上しましたが、Transformer アーキテクチャの登場により、以前よりも少ない材料でトレーニングできる機械翻訳モデルを作成するための新しい方法が生まれました。多言語 Transformer アーキテクチャを使用すると、多くの場合同じ言語ファミリーまたは関連言語ファミリー内の他の言語の資料を使用してトレーニング データを拡張し、データが少ない言語 (多くの場合、低リソース言語と呼ばれる) のモデルを作成できるようになりました。

これらのテクノロジーを使用しても、ターゲット言語のデジタル ファイルのセットと、それに含まれる別の言語の翻訳 (パラレル ファイルと呼ばれることが多い) が必要です。

▲ Microsoft Translator で翻訳された言語の数の折れ線グラフ。2007 年の 7 言語から 2021 年には 100 言語以上に増加しています。このシステムは2007年から2016年まで統計的機械翻訳(SMT)を使用していました。 2016 年にニューラル機械翻訳 (NMT) テクノロジを採用したことで翻訳品質が向上し、2019 年に Transformer アーキテクチャを採用したことで、Microsoft チームはより少ないデータでリソースの少ない言語のモデルを構築できるようになりました。

マイクロソフトは、新しい言語を追加する場合の最大の課題の 1 つは、機械翻訳モデルのトレーニングと構築に必要な十分なバイリンガル データを取得することだと述べています。このデータは、追加する言語と、サービスが既にサポートしている言語の両方について、人間が翻訳した高品質のコンテンツで構成されています。多くの言語では、特にデジタルリソースが不足している言語や消滅の危機に瀕している言語の場合、このようなバイリンガルデータを入手するのは困難です。

マイクロソフトは、人間が翻訳したテキストにアクセスでき、リソースが不足している言語のデータ収集に貢献できる言語コミュニティのパートナーと協力できることは幸運だと述べている。これらのコミュニティ パートナーは、多くの場合、それぞれのコミュニティで活動しているボランティアであり、コミュニティのメンバーと相談しながら、バイリンガルの文章を収集する手間を惜しみません。次に、得られた機械翻訳モデルの品質を評価しました。

[[428381]]

Azure Cognitive Services Translator は、テキスト翻訳 API およびドキュメント翻訳 API を通じて、Microsoft 製品および翻訳顧客に NMT モデルを公開します。これらの API は、プレーンテキストと複雑なファイルをある言語から別の言語に変換します。 Azure Cognitive Services Translator API は、パブリック クラウドと安全な Microsoft Azure Government クラウドで利用できます。さらに、テキスト翻訳 API は Docker コンテナで利用できるため、顧客は企業内でコンテンツを処理して特定の規制要件を満たすことができます。

Azure Cognitive Services Translator には、Custom Translator サービスも含まれています。これにより、ユーザーは独自の翻訳メモリを使用してカスタム機械翻訳モデルを構築し、ビジネスや関連業界で使用されるドメイン固有の用語を翻訳できます。これらのカスタム機械翻訳モデルは、テキストおよびドキュメント翻訳 API を通じて使用できます。

オーディオまたは音声コンテンツを翻訳するために、Azure Cognitive Services Translation は Azure Cognitive Services Speech と緊密に統合されており、Azure Speech SDK を通じて音声翻訳とマルチデバイス会話をサポートします。

Azure Cognitive Services Translator とそれがサポートする製品は、顧客に広く採用されています。このサービスは多くの Microsoft 製品にシームレスに統合されており、誰でも簡単に使用でき、選択した言語でコンテンツを作成できます。 Microsoft 製品の統合には、テキストとファイルの翻訳用の Microsoft 365、Web ページ全体を翻訳するための Microsoft Edge ブラウザー、メッセージの翻訳用の SwiftKey、ユーザーが送信したコンテンツの翻訳用の LinkedIn、外出先での多言語会話用の Translator アプリなどがあります。

<<:  人工知能の時代:知識を活用して人間関係を変える

>>:  人工知能の65年の簡単な歴史:マッカーシーからヒントンまで、人類はどのようなAIを追求しているのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

機械学習とAIを活用してAPIベースのセキュリティソリューションを開発

[[248484]] [51CTO.com クイック翻訳] アプリケーション セキュリティの脅威の背...

人工知能が教育に力を与え、「ゼロポイント革命」が到来

[[266892]]中国共産党第19回全国代表大会の最新報告は、教育の近代化と教育の情報化の流れに対...

...

新素材の画期的な進歩、AIの医療への参入…2021年はどんな新しい技術トレンドを迎えるのでしょうか?

2020年も終わりに近づいていますが、疫病は科学技術の進歩を止めることはなく、量子コンピューティン...

この記事ではSentinelと一般的なフロー制御アルゴリズムを紹介します。

[[401361]]この記事では主に、カウンター アルゴリズム、リーキー バケット アルゴリズム、...

米国のAI雇用市場の現在の規模を解読する

[[342720]] 人工知能の分野でのこの国の雇用機会はどのようなものでしょうか?私たちはすべてが...

...

...

中国ダイビングチームの勝利には人工知能が貢献した

ネットユーザーたちはこのオリンピックについて不満を述べている。たとえ境界線を越えたとしても、高得点を...

研究者は、現在のAIトレーニングの効率が低すぎると不満を述べている

海外メディアによると、グーグルの研究者は以前、グーグルが現在検索やその他のテキスト分析製品に使用して...

AI導入の最大の障壁:熟練した専門家の不足

VentureBeat によると、人工知能 (AI) が革命的なメリットをもたらしたという点について...

オートメーション・エニウェア、世界初のウェブベースRPAプラットフォームを発表

RPA(ロボティック・プロセス・オートメーション)業界のリーダーであるオートメーション・エニウェアは...

「ユーザーを数える」、なぜTikTokはこんなにも中毒性があるのでしょうか?

かわいい子犬や遊び好きな子猫を見るのが好きな人はいないでしょうか?特に、新型コロナウイルス感染症のパ...

英国のAIスタートアップFacultyが4250万ドルのシリーズA資金調達を完了

5月25日、英国の人工知能企業Facultyは、Apax Digital Fund(ADF)が主導す...

...