IT Homeは10月12日、Microsoft Translatorが本日、12の新しい言語と方言をサポートすると発表したと報じた。このサポートにより、Microsoft Translator は現在合計 103 の言語をサポートし、世界人口の 72% をカバーしています。このリリースにより、Microsoft Translator はテキストやドキュメントを世界中の 56 億 6 千万人の母国語に翻訳できるようになります。 IT Home は、Microsoft Translator に新しく追加された言語が、バシキール語、ディベヒ語、グルジア語、キルギス語、マケドニア語、モンゴル語 (キリル文字)、モンゴル語 (繁体字版)、タタール語、チベット語、トルクメン語、ウイグル語、ウズベク語 (ラテン文字) であることを知りました。これらの新しい言語を話す人は8,460万人です。 「100 の言語は、あらゆる人がどんな言語を話す人でもコミュニケーションできるようにするという私たちの目標の達成に向けた大きなマイルストーンです」と、マイクロソフトのテクニカル フェロー兼 Azure AI CTO である Xuedong Huang 氏は述べています。 Microsoft Translatorの進化Microsoft Research は 20 年以上前に初めて機械翻訳システムを開発しました。 2003 年、機械翻訳システムにより、Microsoft Knowledge Base 全体が英語からスペイン語、フランス語、ドイツ語、日本語に翻訳され、その翻訳が Web サイトで公開されました。これは、当時インターネット上で最大規模の公開型機械翻訳アプリケーションとなりました。 Microsoft は、統計的機械翻訳 (SMT) モデルに基づいてこれらのシステムをさらに開発し、Windows Live Translator、Translator API、および Microsoft Office アプリケーションの組み込み機能を通じて一般に公開しました。 マイクロソフトは、長年にわたり、世界で最も一般的に使用されている言語の多くに翻訳システムを追加してきたと述べた。マイクロソフトは、人工知能 (AI) 技術の発展に伴い、ニューラル機械翻訳 (NMT) 技術を採用し、すべての機械翻訳システムを Transformer 技術に基づくニューラル モデルに移行し、翻訳の流暢性と正確性の大幅な向上を実現しました。 NMT テクノロジーによって翻訳全体の品質が大幅に向上しましたが、Transformer アーキテクチャの登場により、以前よりも少ない材料でトレーニングできる機械翻訳モデルを作成するための新しい方法が生まれました。多言語 Transformer アーキテクチャを使用すると、多くの場合同じ言語ファミリーまたは関連言語ファミリー内の他の言語の資料を使用してトレーニング データを拡張し、データが少ない言語 (多くの場合、低リソース言語と呼ばれる) のモデルを作成できるようになりました。 これらのテクノロジーを使用しても、ターゲット言語のデジタル ファイルのセットと、それに含まれる別の言語の翻訳 (パラレル ファイルと呼ばれることが多い) が必要です。 ▲ Microsoft Translator で翻訳された言語の数の折れ線グラフ。2007 年の 7 言語から 2021 年には 100 言語以上に増加しています。このシステムは2007年から2016年まで統計的機械翻訳(SMT)を使用していました。 2016 年にニューラル機械翻訳 (NMT) テクノロジを採用したことで翻訳品質が向上し、2019 年に Transformer アーキテクチャを採用したことで、Microsoft チームはより少ないデータでリソースの少ない言語のモデルを構築できるようになりました。 マイクロソフトは、新しい言語を追加する場合の最大の課題の 1 つは、機械翻訳モデルのトレーニングと構築に必要な十分なバイリンガル データを取得することだと述べています。このデータは、追加する言語と、サービスが既にサポートしている言語の両方について、人間が翻訳した高品質のコンテンツで構成されています。多くの言語では、特にデジタルリソースが不足している言語や消滅の危機に瀕している言語の場合、このようなバイリンガルデータを入手するのは困難です。 マイクロソフトは、人間が翻訳したテキストにアクセスでき、リソースが不足している言語のデータ収集に貢献できる言語コミュニティのパートナーと協力できることは幸運だと述べている。これらのコミュニティ パートナーは、多くの場合、それぞれのコミュニティで活動しているボランティアであり、コミュニティのメンバーと相談しながら、バイリンガルの文章を収集する手間を惜しみません。次に、得られた機械翻訳モデルの品質を評価しました。
Azure Cognitive Services Translator は、テキスト翻訳 API およびドキュメント翻訳 API を通じて、Microsoft 製品および翻訳顧客に NMT モデルを公開します。これらの API は、プレーンテキストと複雑なファイルをある言語から別の言語に変換します。 Azure Cognitive Services Translator API は、パブリック クラウドと安全な Microsoft Azure Government クラウドで利用できます。さらに、テキスト翻訳 API は Docker コンテナで利用できるため、顧客は企業内でコンテンツを処理して特定の規制要件を満たすことができます。 Azure Cognitive Services Translator には、Custom Translator サービスも含まれています。これにより、ユーザーは独自の翻訳メモリを使用してカスタム機械翻訳モデルを構築し、ビジネスや関連業界で使用されるドメイン固有の用語を翻訳できます。これらのカスタム機械翻訳モデルは、テキストおよびドキュメント翻訳 API を通じて使用できます。 オーディオまたは音声コンテンツを翻訳するために、Azure Cognitive Services Translation は Azure Cognitive Services Speech と緊密に統合されており、Azure Speech SDK を通じて音声翻訳とマルチデバイス会話をサポートします。 Azure Cognitive Services Translator とそれがサポートする製品は、顧客に広く採用されています。このサービスは多くの Microsoft 製品にシームレスに統合されており、誰でも簡単に使用でき、選択した言語でコンテンツを作成できます。 Microsoft 製品の統合には、テキストとファイルの翻訳用の Microsoft 365、Web ページ全体を翻訳するための Microsoft Edge ブラウザー、メッセージの翻訳用の SwiftKey、ユーザーが送信したコンテンツの翻訳用の LinkedIn、外出先での多言語会話用の Translator アプリなどがあります。 |
>>: 人工知能の65年の簡単な歴史:マッカーシーからヒントンまで、人類はどのようなAIを追求しているのでしょうか?
インテリジェント トランスフォーメーションの本質: インテリジェント トランスフォーメーションは、テ...
今日の IT 界で最もホットなテクノロジーについて語るとき、人工知能について触れなければなりません。...
この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
12月25日のニュース、シリコンバレーのテクノロジー企業の幹部たちは理解しにくい人々の集まりだ。彼ら...
今週、OpenAIのビデオAIツール「Sora」が登場するや否や大きな話題を呼んだ。 「仕事を失う」...
[[434314]]ディープフェイクを使って古い写真をアニメ化し、殉教者を追悼するのは良いことだが、...
現在、人類社会が直面している人工知能のセキュリティ問題は、人工知能のアルゴリズムとシステムの特性によ...
脅威の状況が絶えず変化する中、高度なサイバー攻撃に対する防御手段として、生成型人工知能 (GAI) ...
ロイター通信は10月4日、ソフトバンクグループの創業者兼CEOの孫正義氏が本日、汎用人工知能(AGI...