視聴者が足りないなら、噂話で十分だ まずは噂話から始めましょう。 この記事を書き始めた頃、翻訳界で「爆発的な」事件が起こりました。 6月27日の午後、同時通訳者が友人の輪の中で次のようなニュースを明かした。あるAI企業が、この通訳者に機械同時通訳者の役割を「演じ」、人工知能が人間の同時通訳者に取って代わるという「衝撃的な」効果を生み出すよう依頼したのだ。 この事件は、翻訳者たちのモーメンツ、微博、微信のグループ内で、長い間抑えられていた火薬庫を一瞬にして爆発させた。 というのも、ここ数ヶ月、同時通訳に取って代わると主張する翻訳機がときどき登場しており、特に「発表されました: 同時通訳はもうすぐ終焉を迎えます!」というタイトルの WeChat 記事は、6 月下旬に関連または無関係の多数の公開アカウントで溢れ、10 万回以上の閲覧数を何件獲得したかわかりません。 翻訳業界に携わるほとんどの人は、友人から同情と心配の口調で転送された記事を受け取ったことがあるでしょう。最初は「ははっ」という感じでしたが、だんだんイライラしてきて、最終的には上記の事件に激怒してしまいました。 @同時翻訳 Weibo の cherry sheep さんはこう言っています: ステージ上には、華やかで尊敬されているスピーカーたちもいました。彼らは私たちのサービスを楽しんでいる一方で、同時通訳者は将来すべて失業するだろうと述べ、この業界を深く軽蔑していました。「あなた方は将来、すべて交代させられるのに、なぜ私たちがあなた方の気持ちを気にかけなければならないのですか?」 勇気があるなら、私たちを招待しないでください。招待したからには、こう言う前に、現場で一生懸命働いてくれた私たちの同僚たちに謝罪していただけませんか? これは「蓄積された恨み」がいかに深いかを示しています。 その後、事件は少々劇的な展開を見せた。 2日後、記事「消失」で宣伝されていた翻訳機「Xiaoyi」のメーカーであるiFlytek(注:上記の詐欺がiFlytekに関連しているという証拠はない)は、公式アカウントで「人工知能技術の神格化を拒否し、着実に前進」と題した記事を公開した。重要なポイントは次の 2 つの段落にあります。 現在、機械翻訳は大きな進歩を遂げており、食べ物、衣服、住居、交通など日常よく使われる表現の中英翻訳は大学6年生レベルに達し、いくつかの場面で人々の言語コミュニケーションの問題に対処するのに役立ちます。しかし、会議の同時通訳やハイレベル翻訳に求められる「忠実性、表現力、優雅さ」との間には依然として大きな隔たりがあります。 iFlytekが目指すのは、同時通訳に代わるものではなく、音声文字変換と翻訳技術を通じて同時通訳者の作業効率を向上させ、ミスを減らすこと、そして人間と機械が連携した新しい同時通訳モデルを形成することです。 まあ、結局、私は「神格化」され、それを「拒否」したのです。しかし、いずれにしても、この記事が発表されると、真実を知らない多くの人々から異口同音に賞賛されました。 憤慨した翻訳者たちはすぐに、裏方として控えめで控えめな態度に戻った。偽造者を摘発せよという呼びかけさえも、即座に沈黙させられた。 人間による翻訳の世界で機械翻訳者として働く私としては、この事件は一般の人々と機械翻訳者/AI 労働者の両方の間で翻訳業界に関する深い誤解を露呈させたと感じています。 この記事の本来の目的は、機械翻訳の発展における人間と機械の統合の重要性を探ることです。したがって、まずこれらの誤解を解く必要があります。 GitChat の読者はより技術的な詳細を期待しているかもしれませんし、私も最初はより技術的なスタイルで書くつもりでした。 しかし、上記の事件の後、人間と機械の統合モデルの技術的な実装に関心を持つ前に、問題の本質を探求する必要があると私は考えています。 人間の労働力を置き換えようと野心を持つ人は、まず何を置き換えるのかを知らなければなりませんよね? 誤解1:翻訳は単なる機械的な言語変換である 翻訳の仕事については誤解が多くありますが、これが最も核心的な点です。他の多くの誤解(例えば、外国語がわかる人なら誰でも翻訳者になれる、翻訳の才能はどこにでもいる、専門的な知識がなくても翻訳ができるなど)と、それに伴う軽蔑(翻訳には技術的な内容がない、自由に置き換えできる、価値がないなど)は、これに根ざしています。 なぜこれほど多くの人が「一致して」翻訳がすぐに置き換えられると信じているのでしょうか? 注目を集める自主メディアに加えて、「置き換え派」には、カーツワイル、ロビン・リー、リー・カイフー、王小川など、あまりにも多くのインターネットの巨人が含まれています。この背後にあるロジックを見てみましょう。 李開復氏は新著『人工知能』の中で、「5秒ルール」を提唱している。それは、もともと人間が行っていた仕事で、その仕事に必要な思考や意思決定の問題に対して5秒以内に対応する判断を下すことができれば、その仕事は人工知能技術によって完全に、あるいは部分的に置き換えられる可能性が非常に高いというものだ。 そして、本書では「5秒ルール」に基づき、翻訳、ニュース報道、アシスタント、警備、営業、顧客サービス、取引、経理、運転、ハウスキーピングなどの職に就く人々の約90%が、今後10年間で人工知能によって完全に、または部分的に置き換えられると予測しています。 明らかに、翻訳は残念ながら「5秒」で解決できる最初の問題です。同時通訳という華やかな仕事のせいで、人々は「翻訳なんてほんの数秒で終わるのでは?」という幻想を抱いているのかもしれません。しかも、同時通訳は翻訳の仕事の中でも最も難しく、最も費用がかかると言われていますが、他の翻訳の仕事はもっと簡単なのではないでしょうか? 現実はどうでしょうか? 通訳者は、会議通訳の準備をするために、事前に数え切れないほどの日々の宿題をこなし、会議前に多くのコミュニケーションと調整を行い、会議中に変化する状況に適応できるようにさらに注意を払わなければならないことを知っています。言うまでもなく、同時通訳ができるレベルに到達するには、何年もの厳しい訓練が必要です。通訳者の仕事は、「舞台上では1分、舞台外では10年間の努力」と表現するのが適切です。翻訳作業は決して簡単なものではなく、質の高い翻訳を作成するには何年もの練習も必要です。 さらに、この誤解には実際には 2 つの主張が含まれています。
実際のところ、これらの主張は両方とも真実ではありません。 最初の質問としては、翻訳の本質について疑問を抱く必要があります。翻訳は言語サービスです。言語サービスに関しては、最近、広東外国語大学の李瑞林教授の定義を見ましたが、これが最も本質に近いと思います。言語サービスは、言語リソースに基づいた社会経済的プロセスであり、知識、エンパワーメント、共感を目標とし、人々や組織間での知識と経験の伝達を実現します(「言語サービスの概念的枠組みの再考:存在的基礎、普遍的本質、実践的論理」を参照)。 言語は翻訳サービスの実装の担い手であり、サービスそのものではないことがわかります。翻訳の仕事を通じて得られる知識、経験、そして感情こそが最も大切なものなのです。李開復氏らは、これらの事柄が機械にとって扱いやすいとは考えていないだろうと私は信じています(記憶できる静的な知識を除く)。 2 番目の質問については、「言語」の本質をさらに探求する必要があります。言語が情報の伝達手段であることは周知の事実です。たとえば、「リンゴ」というメッセージを他の人に伝えたいとき、果物屋やハイテク体験店に連れて行く必要はありません。 しかし、この情報媒体はロスレスではありません。「リンゴ」という概念を使う場合、形、色、感触、匂い、効用など、具体的な情報をすべて伝えるのは明らかに不可能です。相手は脳内でその他の情報を「埋め込む」必要があります。 したがって、言語は実際には情報処理プロセスにおけるエンコードされた「ショートカット」にすぎません。ショートカットによって表される情報が解読できるかどうかは、情報受信者の認知構造によって決まります。これは「千人の読者には千のハムレットがある」と呼ばれるものです。 翻訳者は、デコーダーとエンコーダーの両方の役割を担う必要があります。翻訳者は、他の言語の読者の認知構造の違いを考慮しながら、短期間で自分の認知構造を元の著者の期待に近づける必要があります。変換の難しさは想像に難くありません。 したがって、翻訳は私たちが考えるほど簡単ではありません。この記事のプレビューでは、いくつかの言語特性を挙げました。「開放性」、「曖昧さ」、「進化」などの問題が翻訳に大きな困難をもたらしています。 機械翻訳が人間の翻訳に匹敵するか、それを超えることを望むなら、機械翻訳を何らかの形で「単純化」することに頼るのではなく、まずその難しさや価値に向き合わなければなりません。そうでなければ、卓球代表チームを壊滅させることで「サッカー代表チームを卓球代表チームと同じレベルに引き上げよう」としているようなものではないでしょうか。 誤解2: 人間による翻訳は「良い翻訳」である これは人工知能の研究者の間でよくある誤解かもしれませんが、機械翻訳に対して皆が概して非常に楽観的である理由の 1 つでもあります。 「チューリングテスト」の考え方に影響を受け、「機械翻訳に良い翻訳をさせる」という問題を、「機械翻訳によってなされた翻訳が、人間が行ったのか機械が行ったのか分からないようなものであれば、それは良い翻訳である」という問題に変換します。 したがって、統計的機械翻訳であれ人工ニューラル ネットワークであれ、ほとんどの機械翻訳トレーニングでは、手動で翻訳されたコーパスを使用した「最大尤度」をトレーニング目標として使用します。つまり、機械翻訳がパラレルコーパスの翻訳にできるだけ近くなるようにする方法を見つけます。 この仮説には以下のサブ仮説が含まれています。 人間による翻訳のレベルは、品質尺度における黄金の境界線です。 このカットオフポイントは、並列コーパス(十分な量がある場合)から学習できます。 一般的なバイリンガル話者であれば、翻訳の品質がこのカットオフポイントを超えているかどうかを確実に判断できます。 残念ながら、これらの仮定は、問題のより適切な正式な定義と比較的一貫した評価基準を得るために私たちが行った単純化された仮定でもあります。 問題に対する「完璧な」解決策にまだほど遠い場合、これらの仮定は、実用的で有用な近似解決策を作成するために非常に役立ち、必要です。 しかし、これらの仮定の下で得られた局所最適解の大幅な改善を、全体最適解に非常に近いものとみなすと、臨界点を突破しようとしているという錯覚が生じます。これは真実の探求には役立ちません。 上記のサブ仮説を一つずつ説明してみましょう。 まず、手動翻訳のレベルは、品質尺度上の点ではなく、30 ポイントから 99.99 ポイントなど、上限と下限が非常に広い範囲であることは明らかです。下限が機械翻訳のレベルより低いのは普通です。さらに悪いことに、このスケールのスケール値(間隔測定単位が必要な労力である場合)は均等間隔ではありません。 例えば、59と60の間隔が1cmだとすると、95と96の間隔は1メートル、98と99は数キロメートルになるかもしれません...では、人間による翻訳の水平線はどこに設定すればよいのでしょうか。これには多くの知見があり、例えば、区切り点を60ポイントに設定し、機械翻訳のスコアが30ポイントから57ポイントに向上した場合、目標は90%達成されたと言えるのでしょうか。 たとえ99点という高い基準を設定し、機械翻訳が39点から69点へと30点向上したとしても、99点までまだ30点残っているのに、道のりの半分を終えたと言えるのでしょうか。残念ながら、長征は第一歩に過ぎません。しかし、私たちはそれを当然のこととして受け止め、自分たちが歩んできた道を誇示するのは簡単です。 たとえば、昨年の Google GNMT 論文では、この方法で 87% の改善が計算されました (特定の言語については、元の論文を見つけて、その評価データと結論の関係を分析できます)。すでに凱旋門で勝利の旗を振っているのが見えます... 第二に、他の自然言語処理タスクと比較すると、機械翻訳は、並列コーパスなどの自然にラベル付けされたデータ リソースが利用できるため、より成功しているように見えます。パラレルコーパスが人間によって翻訳されている限り、品質を測定するためのゴールドスタンダードとして使用できるようです。しかし、問題は次のとおりです。
したがって、バイリンガルコーパスの品質基準に基づくと、これより良い方法はなく、「ゴールド」レベルはまだ十分に高くありません。 3 番目に、品質基準として十分に優れた人間による翻訳が実際に見つかると仮定すると、バイリンガルは人間による翻訳と機械翻訳を正しく区別するのに十分な識別力を持っているでしょうか。言い換えれば、機械翻訳に欠陥があるにもかかわらず、機械翻訳と参照翻訳の不一致が良いのか悪いのか判断できない人がいる状況はあるでしょうか。答えは「はい」です。 それはまるで機械が詩を書いているようなものだ。普通の人は鑑賞能力や経験が限られているため、機械が書いたものかどうかは分からないかもしれない。だからこそ、マイクロソフトのロボット「Xiaoice」は、発見されることなく、さまざまな文学コミュニティに潜んでいるのだ。しかし、言葉に敏感な人は、依然として良い詩をふるいにかけることができます。Xiaoice が発行する詩集は、実際には手作業で「選ばれています」。 この場合、資格、職業、文化、目標、状況が異なる人々は、翻訳の品質に対して異なる認識を持っています。チューリングテストの識別者としてどのような人を選ぶかについても、慎重に検討する必要があります。 これら 3 つのサブ仮説はすべて、実際の問題とは多少異なります。現在頼りにしている評価システムでは、十分なフィードバックを提供できないことがわかります。まさにこれが、囲碁をプレイするAlphaGoとの最大の違いです。 AlphaGo の最も強力な点は、自分自身と対戦することで継続的にレベルを向上させることができることであり、自分自身と対戦するという前提が勝敗を決定する明確な基準となっていることがわかっています。しかし、翻訳の良し悪しを判断するための適切な評価メカニズムは存在しません。 今年非常に人気が高まった敵対的生成ネットワーク(GAN)が機械翻訳に効果的であることが証明されたのもこのためですが、その結果はそれほど印象的ではありません。突破口を開きたいのであれば、評価の仕組みにもっと注意を払う必要があります。 誤解 3: 翻訳市場は非常に小さいため、機械がより多くの作業を行うと、人間の作業の余地が少なくなります。 実際、翻訳市場を囲碁の盤に例えると、人間の翻訳者が黒を、機械翻訳者が白をプレイし、双方が都市を征服し領土を奪い合いながら必死に戦い、一方が台頭し、もう一方が後退する、いわゆる「代替」問題が発生するだろう。 しかし、実際の翻訳市場の構造はどのようになっているのでしょうか?下の図を見てみましょう。 このグラフは業界調査レポートから引用したものです。企業内のテキストコンテンツをピラミッドに例えると次のようになります。
そして、これらの未翻訳コンテンツは 99% を占めています。 言い換えれば、手動翻訳であれ機械翻訳であれ、未開の地はまだ広大な土地が残っており、その大部分では、実現可能な解決策を提供するために人間と機械が協力する必要があるかもしれない。 ご存知のように、観光、電子商取引、ソーシャルチャットなど、今日機械翻訳が最も一般的に使用されているシナリオは、以前は人間による翻訳の領域ではありませんでした。 今後、カスタマーサービス、ナレッジベース、UGC などのシナリオにおける言語サポートには、基本的に機械のスピードと人間の信頼性や温かさの両方が求められ、人間と機械の組み合わせによってのみ実現できるようになります。 さらに、上記のピラミッドの大きさは静的ではありません。インターネットと人工知能の発展により、世界の情報の流れは加速しており、コンテンツの規模は絶えず拡大しており、全体的な需要は拡大し続けるだけです。人間と機械が楚と漢の境界で出会うことができるのはいつでしょうか? さあ、本題に入りましょう ちょっと待ってください、予約時に合意したことはどうなったのですか? なぜいつもこのような誤解が生じるのでしょうか? 実際、翻訳業界や翻訳職については、いまだに多くの誤解があります。なぜこの 3 つのポイントを取り上げるのか。それは、この 3 つのポイントが最も重要であるからというだけでなく、この 3 つのポイントを明確にすると、私たちのメイン トピックと予定されている通知の最初の質問 (なぜ人間と機械の統合が必要なのか) に対する答えが非常に明確になるからです。
機械翻訳/人工知能に取り組んでいる同僚にとって、この記事が何か考えるきっかけになれば幸いです。上記の見解は必ずしも正しいとは限りません。しかし今日、ディープラーニングの最新の成果を注意深く見守る中で、私たちも頭を下げて、まだ何が足りないのか、そして目に見える成果を得た後に何ができるのかを考えてみるべきなのかもしれません。 翻訳業界の皆さん、機械翻訳が人間の翻訳に取って代わることはできないと知って、ほっとしましたか? しかし、これは機械翻訳によって既存の翻訳者が失業しないという意味ではありません。 次回の記事では、予定発表の2番目の質問(人間と機械の複合翻訳をどうやって行うのか)にお答えします。ちなみに、機械翻訳によって翻訳者が失業する可能性も大いにあります。 |
>>: MSRAがACM TOMM 2017最優秀論文賞を受賞: 複雑でプロフェッショナルなグラフィックデザイン作業をAIに任せよう
8月29日、2019年世界人工知能会議が上海で開幕した。世界各国の著名なテクノロジー企業や学界、産業...
「これは、ノーベル賞受賞が期待される最初の人工知能の成果かもしれない。しかし、その画期的な進歩は間違...
建設分野では、ロボット工学は効率性と労働安全を向上させる能力があるため、注目すべきイノベーションであ...
インターネットの出現は「情報爆発」を意味します。ユーザーが心配するのは、もはや情報量が少なすぎること...
好きなように置き換えてください。保持する必要がある領域をフレームするだけで、AI がすべてを置き換え...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
生成型人工知能 (GenAI) の急速な台頭により、企業はビジネス アプリケーションでこのテクノロジ...
「未来の工場には、男性と犬の2人の従業員しかいないでしょう。男性は犬に餌を与え、犬は男性を監視して機...