最近、オンライン機械翻訳ソフトウェアが日本で非常に人気になっています。 この翻訳ソフトはDeepLと呼ばれています。DeepLが人気になった理由は、その信頼性の高さと翻訳の精度の高さにあり、日本でも議論を巻き起こしました。 日本のネットユーザーの個人的なレビューから判断すると、日本語の方言の翻訳効果が優れているだけでなく、古典中国語までも処理されています。これはGoogle翻訳でもできないことです。 しかし、どの程度正確でしょうか?厳密な技術ソフトウェアなので、当然ながらデータと対話する必要があります。DeepLは、日本語から英語への翻訳と中国語から英語への翻訳のブラインドテスト結果も公開しました。下の図に示すように、DeepLが圧倒的な存在であることがわかります。 ブラインドテストとは、プロの翻訳者がどの翻訳バージョンがどのウェブサイトで翻訳されたかを知らされないまま、翻訳されたテキストを評価することです。これは、DeepL が常に採用してきたテスト方法の 1 つです。 DeepLは、その優れた精度でRedditでも話題になりました。一部のネットユーザーは、DeepLはGoogle翻訳のように単語を翻訳しない、と指摘しています。Textractorの設定から、DeepLは以前の翻訳を文脈として使用して翻訳結果を向上させることもサポートしていることがわかります。 多くのネットユーザーも「DeepLはすごい!」と直接叫んでいました。 3年前、DeepLが初めて世間の注目を集めたとき、DeepLは大きな注目を集めました。DeepLのCEOであるGereon Frahling氏はかつて、DeepLの目標は翻訳タスクに限定されないと述べました。ニューラルネットワークはテキストの理解から始まり、より多くの可能性を切り開きます。 今後どのように発展していくかについては、文在寅が少し評価し、その後DeepLの発展の歴史を一緒に見ていきましょう。小さな椅子が置かれていますので、どうぞお座りください~ 方言、古典中国語、学術論文、機械翻訳は神々の戦いのようなものです! プライベートな評価でも、DeepL の公式ブラインドテストの結果でも、DeepL は現在利用可能な最も正確な機械翻訳である可能性が示唆されています。その真の品質を知るには、やはり自分で試してみる必要があります。 今回のアップデートには簡体字中国語も含まれているため、少しの疑問と好奇心を抱きながら、私もDeepLの簡単な評価を行い、現在主流のGoogle翻訳、Microsoft翻訳、百度翻訳、Youdao翻訳と比較してみました。 この評価は3ラウンドに分かれており、第1ラウンドは方言、第2ラウンドは古典中国語、第3ラウンドは学術論文です。さて、それでは5名の出場者を募集したいと思います。 第1ラウンドでは、方言を見てみましょう。 周知のように、中国の方言文化は奥深く広範囲にわたります。方言を正しく翻訳できなければ、正確性は依然として疑問視されます。 私たちは北東部方言でレベル 10 の質問を選択しました。「なんてことだ、あなたは本当に醜い。」この質問には 2 つの採点ポイントがあり、1 つは「なんてことだ」、もう 1 つは「醜い」です。 5人の選手のパフォーマンスを見てみましょう。 最初の採点ポイントでは、Googleは「そこに行きます」と翻訳し、MicrosoftとBaiduは「行きます」と解釈し、Youdaoは「わかりません」と答え、DeepLは優れたパフォーマンスを発揮し、驚いた口調で「あらまあ」と正しく翻訳しました。 2番目の採点ポイントでは、5人の出場者全員が異なる答えを出しました。Googleは「内気」、Microsoftは「高慢」、Baiduは「みすぼらしい」、Youdaoは「悪い」、DeepLは「醜い」です。 得点から判断すると、Baidu は 2 番目の質問でまずまずの成績を収め、Youdao はかろうじて合格しましたが、Google と Microsoft は完全に敗退しました。 DeepLのフルスコアテスト用紙を見てみましょう。 これは最初の質問に過ぎません。心配しないでください。状況を好転させるチャンスはまだあります。次に、古典中国語を見てみましょう。DeepLは古代日本語を翻訳できるので、古代中国語を翻訳できないのは間違いです。 第二ラウンドは、古典中国語です。 中国語の古典の部分では、有名な唐代の詩人、張九齢の「観月遠慮」という詩の中の「明るい月が海の上に昇り、世界中の人々がこの瞬間を共有する」という有名な一節をテストのテーマにしました。この詩の一節は、明るい月が広大な海の上に昇り、遠くにいる親戚や友人を思い起こさせるという意味です。彼は今この瞬間、同じ明るい月を見ているはずです。 この問題の採点基準は、出場者が詩全体の雰囲気を英語で表現できるかどうかです。さて、中国語版の標準解答が発表されましたが、5人の出場者の実力はどうだったのでしょうか? まず、文章の意味から言うと、Google、Microsoft、Baiduはいずれも後半部分の翻訳を断念しました。Youdaoは後半部分を「天耶今」と翻訳しました。前半部分の翻訳では、MicrosoftとBaiduはともに「生まれる」という言葉を使いましたが、Microsoftの翻訳は「海が生まれる」でした。 ? ? ? DeepLで見てみましょう。前半の文章はGoogleの回答と全く同じですが、後半の翻訳が忠実度、表現力、優雅さのレベルに達しているかどうかはわかりませんが、読んでいてとても気持ちがいいです。一緒に味わいましょう。 最後の質問でもある3番目の質問では、出場者の学術論文を中国語と英語に翻訳する能力がテストされます。 学術論文の鍵は、滑らかな文章だけでなく、専門用語の正確さであり、それがこの試験の焦点でもあります。 中国語から英語への翻訳には、昨年International Journalismに掲載された記事を選びました。研究者らは、ソーシャルメディアの信頼がプライバシーリスクの認識と自己開示に与える影響を調査しました。 原文: 実証結果から、1. プライバシーリスク認識と自己開示の間には有意な相関関係がないことが示されています。2. ソーシャルメディアの信頼は、ユーザーのプライバシーリスク認識に悪影響を及ぼし、オンラインの対人関係の信頼は仲介の役割を果たしています。3. ソーシャルメディアの信頼は、ユーザーの自己開示に好影響を与え、オンラインの対人関係の信頼は仲介の役割を果たしています。 翻訳結果から判断すると、5人の参加者の回答は非常に満足のいくもので、文の構造や文法に問題はありません。唯一の違いは、特定の言葉遣いにおいてそれぞれが独自の長所を持っていることです。たとえば、「自己開示」については、DeepLとMicrosoftは「自己表現」と翻訳したのに対し、他の3社は「自己開示」と翻訳しました。また、「ネットワーク対人信頼」については、Youdao、Baidu、Microsoftは「ネットワーク対人信頼」と翻訳したのに対し、Googleは「オンライン対人信頼」と答え、DeepLは「サイバー対人信頼」と翻訳しました。 いつものように、DeepLの回答を見てみましょう。 英語から中国語への翻訳では、先週 Wenzuijun 氏が報告したインペリアル・カレッジ・ロンドンの論文の序文を選択しました。ユーザーエクスペリエンスに関して、指摘しておきたいことがあります。中国語から英語、英語から中国語に切り替える場合、 Baidu、Youdao、DeepL のみが自動認識を実現していますが、Google と Microsoft では依然として手動の言語選択が必要です。 原文:COVID-19の世界的な影響は甚大であり、それがもたらす公衆衛生上の脅威は、1918年のH1N1インフルエンザの大流行以来、呼吸器ウイルスとしては最も深刻です。ここでは、ここ数週間、英国やその他の国で政策立案の参考となった疫学的モデリングの結果を紹介します。COVID-19ワクチンが存在しない状況で、人口の接触率を減らし、それによってウイルスの感染を減らすことを目的とした、いわゆる非医薬品介入(NPI)と呼ばれるいくつかの公衆衛生対策の潜在的な役割を評価します。ここで示す結果では、以前に発表されたマイクロシミュレーションモデルを2つの国、英国(具体的にはグレートブリテン)と米国に適用しています。私たちは、1つの介入を単独で行った場合の有効性は限られている可能性があり、感染に大きな影響を与えるには複数の介入を組み合わせる必要があるという結論に達しました。 結果から判断すると、 5人の出場者の学力はいずれも比較的高く、学術言語の使用の標準化にも大きな違いはありません。しかし、細部にこそ悪魔が潜んでいる。Youdaoだけが二重ダッシュの使用を維持したが、これは実際には中国語では一般的ではない。Youdaoを除く他の3人の参加者は「非医薬介入(NPI)」を完璧に表現していなかった。 それでも、DeepLは最後に笑いました。さまざまな小さな問題が残っていて満点を取れなかったものの、それでも高得点のテストペーパーでした。 上記が今回の評価におけるテスト問題の全問です。DeepLがシードプレイヤーのナンバーワンにふさわしいことがわかります。方言、古典中国語、学術談話のいずれにおいても、優れた成績を収めています。DeepLの担当者は相変わらず非常に誠実であるようです。 Linguee から変換された機械学習が DeepL を強化 DeepL の「ユニークな」パフォーマンスを確認したところで、今度は、この評価で最高のパフォーマンスを示したトップシードである DeepL に焦点を当てます。 DeepLをご存知ですか? 10年以上運営されているオンライン外国語辞書「Linguee」をご存知でしょうか。DeepLの前身はLingueeです。 Linguee は長年使用されている翻訳ツールです。広く使用されており、忠実なユーザー グループもいますが、ブランドとステータスの面で Google 翻訳が大きな優位性を持っていることを考慮すると、その翻訳品質は Google 翻訳とは比較になりません。 しかし、本当に重要なのは、Linguee の技術的蓄積です。Linguee の共同創設者である Gereon Frahling 氏は、以前は Google Research で働いていました。2007 年に、彼は新たな旅を始めることにしました。チームは数年間、機械翻訳に取り組んできました。2016 年になってようやく、彼らは新しいシステムを本格的に開発し、新しい会社 DeepL を設立し始めました。 Linguee の核となる競争優位性は、クローラーと機械学習システムです。前者はインターネット上の 10 億件を超える翻訳結果とクエリの大規模なデータベースをキャプチャでき、後者は Web ページ上の類似フラグメントの実際の翻訳方法を検索して評価します。この 2 つを組み合わせることで、Linguee は当時「世界初の翻訳検索エンジン」となりました。 10年間の蓄積を経て、Lingueeのデータとアルゴリズムに関する研究は過小評価されなくなり、それが直接DeepLの絶対的な優位性となり、チームが新しいモデルをトレーニングするための強固な基盤を築きました。
DeepLの革新的なニューラルアーキテクチャは、5.1ペタフロップス(1秒あたり51兆回の演算)の処理能力を持つアイスランドのスーパーコンピューターで実行されており、 100万語を1秒未満で翻訳できます。 「アイスランドでは再生可能エネルギーが豊富なので、ここではニューラルネットワークを非常に安価にトレーニングできます。私たちは引き続き高性能ハードウェアに注力していきます」とDeepLのCTO、ヤロスワフ・クティロウスキー氏は語った。 「私たちはニューラル ネットワーク アーキテクチャにおいていくつかの重要な改善を達成しました」と Gereon Frahling 氏は述べています。「ニューロンとその接続を異なる方法で配置することにより、私たちのネットワークは現在利用可能な他のニューラル ネットワークよりも完全に自然言語をマッピングします。 」 大学、研究機関、Linguee の競合他社によって発表された研究の進歩は、DeepL が以前使用していた再帰型ニューラル ネットワークではなく、畳み込みニューラル ネットワークが機械翻訳の最適な方法であることを示唆していますが、今は両者の違いを議論する場合ではありません。関連する単語の長く複雑な文字列の場合、畳み込みニューラル ネットワークの弱点を制御できる限り、畳み込みニューラル ネットワークの方が適しています。 たとえば、CNN は一度に 1 つの単語を処理するため、文の最後の単語によって最初の単語の構成が決まる場合に問題が生じます。ネットワークが取得した最初の単語が間違っていた場合、最初の単語を見つけるために文全体を検索するのは無駄であり、その知識を使用して最初からやり直す必要があります。そのため、DeepL や機械学習分野の他の技術では、CNN が次の単語またはフレーズに進むときに、このような潜在的な問題を監視する「アテンション メカニズム」を使用しています。 DeepLの最新バージョンでは、漢字、ひらがな、カタカナに加え、数千の中国語の文字を含む日本語と中国語(簡体字)のサポートが追加されました。現在、DeepLがサポートする言語数は11に増えました。Google翻訳やBing Microsoft Translatorなど、100以上の言語をサポートする他の翻訳サービスほど言語サポートは充実していませんが、翻訳精度も無視できない重要なポイントです。 多言語対応のテッククランチ編集者フレデリック氏はかつてDeepLについて次のようにコメントした。「Google翻訳のスタイルは非常に直接的ですが、細かい部分や慣用句が抜け落ちています(または、これらの慣用句を誤って翻訳しています)。一方、 DeepLはよく訓練された人間の翻訳者のように、より自然な翻訳結果を提供できることが多いです。」
ここまで言っても、真実を知るには自分で試してみないとわかりません。興味のある学生は自分で試してみてください。面白い翻訳結果に出会ったら、Wen Zhaijunに伝えてくださいね~ 最後に、公式ウェブサイトのリンクをここに示します。 https://www.deepl.com/translator |
>>: アプリケーション管理における AI/ML のユースケース
ビジネス インテリジェンス戦略の策定は、企業が検討する必要がある重要なステップであり、ビジネス イン...
「そう遠くない将来、スマートホームシステムを備えていない家庭は、インターネットにアクセスできない今...
[[438415]]クラウド コンピューティング業界が成長を続ける中、クラウド コンピューティング...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
最近、オープンソース コミュニティでは、大規模モデルの最適化手法を模索する人が増えています。 LLa...
ドローンと聞いて何を思い浮かべますか?おそらくほとんどの人の答えは写真撮影でしょう。しかし、今回の疫...
[51CTO.comより引用] 現在、AIの幕が開き、人類世界は蒸気時代、電気時代、情報化時代に続く...
歴史は、人々に気づかれずに何度も同じ冗談を繰り返す、昔のいたずらっ子のようなものです。歴史は単なるジ...
拡散モデルは、テキストプロンプトのガイダンスに基づいて高品質でコンテンツが豊富な画像を生成できる、主...
回答1著者: イェ・シャオフェイリンク: https://www.zhihu.com/questio...
[[442794]]人工知能の人気が高まるにつれ、生体認証技術が大きな注目を集めています。特に20...