FenyintaのCTO、張明氏:観光産業を深く掘り下げ、AI技術を使って異言語コミュニケーションの問題を解決する

FenyintaのCTO、張明氏:観光産業を深く掘り下げ、AI技術を使って異言語コミュニケーションの問題を解決する

[51CTO.comからのオリジナル記事] 1930年代初頭、フランスの科学者GBアルチュニは翻訳に機械を使用するというアイデアを提案しました。現在までに、多くの画期的な出来事によって機械翻訳の実現可能性と実用性が確認されており、その幅広い将来性に疑いの余地はありません。機械翻訳をより有効に活用して言語間のコミュニケーション問題を解決するために、GoogleやBaiduなどの国内外の大手企業が相次いで関連チームを設立しました。もちろん、小規模で優れた新興企業もニッチな業界に進出し、サウンドタワーなどの特定のシナリオに焦点を当てています。

最近、Fenyinta CTO の Zhang Ming 氏が 51CTO との独占インタビューに応じました。彼は 1999 年にシンガポールイノベーションテクノロジーで働いていたときに機械翻訳に関わり始めたため、この分野に関して深く独自の洞察を多く持っています。

[[223344]]

サウンドタワーのCTO、張明氏

機械翻訳の3つの主要段階: ルール、統計アルゴリズム (SMT)、ディープラーニング (NMT)

張明氏は、機械翻訳の発展の道筋は他の多くの技術と似ており、技術的な観点からは、ルール、統計アルゴリズム、ディープラーニングという3つの主要な段階に分けられると述べた。

ルール

最初の段階はルールベースのアプローチです。ルールは、言語学者が知識と言語の理解を活用してカスタマイズし、その後、コンピューター分野の専門家によって実装されます。

このアプローチの欠点は明らかです。主な理由は、ルールが網羅的ではないため、ユーザーが入力したすべてのコンテンツがカバーされることを保証する方法がないことです。ユーザーが入力したコンテンツがルールに一致すると、翻訳効果は非常に高くなります。逆もまた同様です。

スマトラ

第 2 段階は統計アルゴリズムに基づいています。翻訳分野のデータが増えるにつれて、統計的手法を使用して大量のコーパス データをモデル化するようになり、言語規則への依存から徐々に離れつつあります。

統計アルゴリズムに基づくアプローチには、実際に言語原理が含まれています。人間の認知力は、翻訳プロセス全体がどのように達成されるかを理解し、解釈することができます。

ナノメートル

3 番目のステージはディープラーニングに基づいています。現在、ディープラーニングはブラックボックスアプリケーションです。異なるモデルに従って翻訳することで最終的な翻訳効果は大幅に向上しますが、実装プロセスを現在の人間の認知に基づいて解釈することはできません。

AIセグメンテーション技術を使用して、ユーザーの視点から製品を反復する

2016年にFenyintaを設立した理由を尋ねられた張明氏は、データとNMTモデルの発展により、2015年頃にNMTがSMTを上回り、全体的な翻訳効果が大幅に向上したと述べました。 2016年には、プログラミング言語NMTが基本的に世界を席巻し、SMTは廃止され、この時期にGoogle Neural Machine Translation(GNMT)も開始されました。機械翻訳の全体的な効果により、特定のシナリオにおけるユーザーの基本的な期待を満たすことができ、関連製品の実装が可能になります。

AI技術を活用して異言語コミュニケーションの問題を解決する

上記の機械翻訳は、テキストからテキスト、中国語から日本語、中国語から英語への純粋な翻訳設定です。しかし、FractionalTower が目指しているのは、AI テクノロジーを使用して言語間のコミュニケーションの問題を解決することであり、翻訳はコミュニケーション プロセスの一部にすぎません。

張明氏は、第1世代のJuner翻訳機の応用シナリオは、誰かの声を相手が理解できる声に翻訳することだと紹介した。この一見単純なロジックの背後には、音声認識、機械翻訳、音声合成などの AI サブテクノロジーがあり、それぞれのテクノロジーを処理するには、異なるシリーズの特定の技術ポイントが必要です。

これらのAIサブテクノロジーのどれに現在欠点があるのか​​と尋ねられた張明氏は、技術的な観点から見ても、ユーザーの市場需要から見ても、決して十分ではないだろうと述べた。現時点では、すべての分野をカバーできる汎用プラットフォームは存在しません。そのため、Fenyinta は観光産業にのみ焦点を当てています。これらの AI 細分化技術を観光業界の特定のシナリオに適用して最適化し、滑らかな音声認識や音の飲み込みなどの問題を解決することによってのみ、翻訳エラーの段階的な増幅や認識エラーによる情報損失を回避し、翻訳機の全体的な理解率を向上させることができます。

ユーザーの視点から製品を改良する

インタビューの中で、張明氏は、Fenyintaは純粋に技術系の会社ではなく、製品やサービスを作る会社であると強調した。ユーザーにいかにしてより良いサービスとより良い体験を提供するかが、同社の核心である。

Juner 翻訳機は、もともと小型で持ち運びしやすいように画面なしで設計されました。その後、コミュニケーション不足の問題を解決するために画面デザインが追加されましたが、表示面ではやや不十分でした。現在使用している世代はタッチスクリーン LED LCD 画面であり、通信プロセスにおいて優れた補助的な役割を果たします。これらの製品の反復はすべて、ユーザーからの実際のフィードバックに基づいています。

次に、Fenyinta はオフラインの側面でさらに調査を行う予定です。旅行のシナリオでは、将来的には Wi-Fi や 5G がカバーしていない場所が多数あるためです。

実際のニーズに応じてバックエンドサーバーを調整および最適化する

ユーザーにサービスを提供する過程でアーキテクチャが調整されたかどうかを尋ねられたとき、張明氏は、初期段階ではバックエンドサーバーの展開を慎重に検討していなかったことを認めました。

観光業界では、販売されているすべての翻訳機を同時に使用することはできないため、ユーザーによる翻訳機の使用には通常、高い同時実行性の問題は発生しません。そのため、バックエンドサーバーの設計時にはあまり考慮せず、当時の通常の機能要件を満たすだけでした。

しかし、実際には、高同時実行の問題は発生しませんが、翻訳機のユーザーがさまざまな国や地域に分散しているため、従来のブロードバンドでは多少の困難が生じます。さまざまな国のユーザーのアクセス速度に影響が及ばないようにするために、展開に適したノードを探すことしかできません。

ここで注目すべきは、実際の展開プロセスでは、主要顧客の分布、使用状況の分布、そして日本、タイ、東南アジアなど、中国人が最も多く出現する国を組み合わせる必要があるということです。

インタビューの最後に、張明氏は、汾銀塔は今後も観光産業に深く根ざし、その中心は依然として、飲食、宿泊、交通、旅行、娯楽、ショッピングの6つの側面を中心に展開していくと語った。 Fenyinta はスタートアップ企業です。大企業のような豊富なリソースやブランドの影響力はないかもしれませんが、より集中しています。すべてのチームは観光分野に集中しています。彼らは真にユーザーのニーズと市場の需要から出発し、より良い製品とサービスを提供することに尽力しています。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  ロボットがすべての仕事を奪ったら、人間はどうなるでしょうか?

>>:  機械学習がサイバー脅威に対する最善の武器である理由

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

現実は素晴らしい、Googleとコーネル大学が提案した実画像補完技術RealFill

休暇で旅行するときは、写真を撮ることが必須です。しかし、景勝地で撮影した写真の多くは、背景に何かが写...

...

...

...

...

...

...

...

...

ビッグデータなどの最も中核的なキーテクノロジー:32のアルゴリズム

[[181277]]オーストリアの記号計算研究所 (RISC) の Christoph Koutsc...

...

人工知能:人種差別との戦いにおける次のフロンティア?

[[350644]]ジョージ・フロイドの悲劇的な殺害が世界に衝撃を与えてから、まだ3か月しか経って...

機器の検査に手作業が必要な人はいますか? AIの活用

著者 | Tu Chengyeレビュー | Chonglou前の記事:「人材が足りないのではなく、A...

ソースディレクトリ内のファイルをプレフィックスに応じて異なるディレクトリに分散するためのアルゴリズム設計と C コードの実装

1. 要件の説明Linux システムのソース ディレクトリには、同じサフィックスを持つファイルがいく...