IT Homeは10月12日、Microsoft Translatorが本日、12の新しい言語と方言をサポートすると発表したと報じた。このサポートにより、Microsoft Translator は現在合計 103 の言語をサポートし、世界人口の 72% をカバーしています。このリリースにより、Microsoft Translator はテキストやドキュメントを世界中の 56 億 6 千万人の母国語に翻訳できるようになります。 IT Home は、Microsoft Translator に新しく追加された言語が、バシキール語、ディベヒ語、グルジア語、キルギス語、マケドニア語、モンゴル語 (キリル文字)、モンゴル語 (繁体字版)、タタール語、チベット語、トルクメン語、ウイグル語、ウズベク語 (ラテン文字) であることを知りました。これらの新しい言語を話す人は8,460万人です。 「100 の言語は、あらゆる人がどんな言語を話す人でもコミュニケーションできるようにするという私たちの目標の達成に向けた大きなマイルストーンです」と、マイクロソフトのテクニカル フェロー兼 Azure AI CTO である Xuedong Huang 氏は述べています。 Microsoft Translatorの進化Microsoft Research は 20 年以上前に初めて機械翻訳システムを開発しました。 2003 年、機械翻訳システムにより、Microsoft Knowledge Base 全体が英語からスペイン語、フランス語、ドイツ語、日本語に翻訳され、その翻訳が Web サイトで公開されました。これは、当時インターネット上で最大規模の公開型機械翻訳アプリケーションとなりました。 Microsoft は、統計的機械翻訳 (SMT) モデルに基づいてこれらのシステムをさらに開発し、Windows Live Translator、Translator API、および Microsoft Office アプリケーションの組み込み機能を通じて一般に公開しました。 マイクロソフトは、長年にわたり、世界で最も一般的に使用されている言語の多くに翻訳システムを追加してきたと述べた。マイクロソフトは、人工知能 (AI) 技術の発展に伴い、ニューラル機械翻訳 (NMT) 技術を採用し、すべての機械翻訳システムを Transformer 技術に基づくニューラル モデルに移行し、翻訳の流暢性と正確性の大幅な向上を実現しました。 NMT テクノロジーによって翻訳全体の品質が大幅に向上しましたが、Transformer アーキテクチャの登場により、以前よりも少ない材料でトレーニングできる機械翻訳モデルを作成するための新しい方法が生まれました。多言語 Transformer アーキテクチャを使用すると、多くの場合同じ言語ファミリーまたは関連言語ファミリー内の他の言語の資料を使用してトレーニング データを拡張し、データが少ない言語 (多くの場合、低リソース言語と呼ばれる) のモデルを作成できるようになりました。 これらのテクノロジーを使用しても、ターゲット言語のデジタル ファイルのセットと、それに含まれる別の言語の翻訳 (パラレル ファイルと呼ばれることが多い) が必要です。 ▲ Microsoft Translator で翻訳された言語の数の折れ線グラフ。2007 年の 7 言語から 2021 年には 100 言語以上に増加しています。このシステムは2007年から2016年まで統計的機械翻訳(SMT)を使用していました。 2016 年にニューラル機械翻訳 (NMT) テクノロジを採用したことで翻訳品質が向上し、2019 年に Transformer アーキテクチャを採用したことで、Microsoft チームはより少ないデータでリソースの少ない言語のモデルを構築できるようになりました。 マイクロソフトは、新しい言語を追加する場合の最大の課題の 1 つは、機械翻訳モデルのトレーニングと構築に必要な十分なバイリンガル データを取得することだと述べています。このデータは、追加する言語と、サービスが既にサポートしている言語の両方について、人間が翻訳した高品質のコンテンツで構成されています。多くの言語では、特にデジタルリソースが不足している言語や消滅の危機に瀕している言語の場合、このようなバイリンガルデータを入手するのは困難です。 マイクロソフトは、人間が翻訳したテキストにアクセスでき、リソースが不足している言語のデータ収集に貢献できる言語コミュニティのパートナーと協力できることは幸運だと述べている。これらのコミュニティ パートナーは、多くの場合、それぞれのコミュニティで活動しているボランティアであり、コミュニティのメンバーと相談しながら、バイリンガルの文章を収集する手間を惜しみません。次に、得られた機械翻訳モデルの品質を評価しました。
Azure Cognitive Services Translator は、テキスト翻訳 API およびドキュメント翻訳 API を通じて、Microsoft 製品および翻訳顧客に NMT モデルを公開します。これらの API は、プレーンテキストと複雑なファイルをある言語から別の言語に変換します。 Azure Cognitive Services Translator API は、パブリック クラウドと安全な Microsoft Azure Government クラウドで利用できます。さらに、テキスト翻訳 API は Docker コンテナで利用できるため、顧客は企業内でコンテンツを処理して特定の規制要件を満たすことができます。 Azure Cognitive Services Translator には、Custom Translator サービスも含まれています。これにより、ユーザーは独自の翻訳メモリを使用してカスタム機械翻訳モデルを構築し、ビジネスや関連業界で使用されるドメイン固有の用語を翻訳できます。これらのカスタム機械翻訳モデルは、テキストおよびドキュメント翻訳 API を通じて使用できます。 オーディオまたは音声コンテンツを翻訳するために、Azure Cognitive Services Translation は Azure Cognitive Services Speech と緊密に統合されており、Azure Speech SDK を通じて音声翻訳とマルチデバイス会話をサポートします。 Azure Cognitive Services Translator とそれがサポートする製品は、顧客に広く採用されています。このサービスは多くの Microsoft 製品にシームレスに統合されており、誰でも簡単に使用でき、選択した言語でコンテンツを作成できます。 Microsoft 製品の統合には、テキストとファイルの翻訳用の Microsoft 365、Web ページ全体を翻訳するための Microsoft Edge ブラウザー、メッセージの翻訳用の SwiftKey、ユーザーが送信したコンテンツの翻訳用の LinkedIn、外出先での多言語会話用の Translator アプリなどがあります。 |
>>: 人工知能の65年の簡単な歴史:マッカーシーからヒントンまで、人類はどのようなAIを追求しているのでしょうか?
Nathan Shipley は、サンフランシスコを拠点とするテクノロジー ディレクター、クリエイテ...
3年半このゲームに一生懸命取り組んだのに、ChatGPT を使用したという理由だけで Steam ...
映画「トンネル戦争」修復前と修復後の比較。画像はインタビュー対象者より提供新華社北京1月1日(記者フ...
人工知能が20年間進歩したにもかかわらず、オフィスワークのほとんどは単純な頭脳労働で構成されているよ...
テスト自動化における人工知能の使用は、品質保証業界を支配する最新のトレンドの 1 つです。実際、キャ...
[[286828]] F5、LVS、HAproxy、nginx など、私たちが普段使用している負荷...
革新的な建設技術により、大規模建設プロジェクトの安全性、効率性、生産性が大幅に向上します。建設業界に...
今年初めにネットで人気を博した反ギャングドラマ「光弗」をまだ覚えているだろうか。最後の数話で監督がス...
[[223288]]人工知能から拡張現実まで、今年、将来を見据えた企業のビジネスを牽引する破壊的なテ...
世界有数の情報技術調査およびアドバイザリ企業であるガートナーによる最近の調査によると、現在人工知能 ...
エッジ AI は IoT および自動化分野のゲームのルールを急速に変え、業界の運営方法に革命をもたら...
「一般的な大きなモデルは国家の運命をめぐる闘争に関連している」... 「人工知能+」が政府活動報告に...
ロヒット・タルワール[[430155]]米陸軍兵士が発射後、管制室から全長14フィートのシャドウ監視...
グッドフェロー:オフィスで働きたくないから転職するというのは本当ですか? AppleやGoogleの...