FenyintaのCTO、張明氏:観光産業を深く掘り下げ、AI技術を使って異言語コミュニケーションの問題を解決する

FenyintaのCTO、張明氏:観光産業を深く掘り下げ、AI技術を使って異言語コミュニケーションの問題を解決する

[51CTO.comからのオリジナル記事] 1930年代初頭、フランスの科学者GBアルチュニは翻訳に機械を使用するというアイデアを提案しました。現在までに、多くの画期的な出来事によって機械翻訳の実現可能性と実用性が確認されており、その幅広い将来性に疑いの余地はありません。機械翻訳をより有効に活用して言語間のコミュニケーション問題を解決するために、GoogleやBaiduなどの国内外の大手企業が相次いで関連チームを設立しました。もちろん、小規模で優れた新興企業もニッチな業界に進出し、サウンドタワーなどの特定のシナリオに焦点を当てています。

最近、Fenyinta CTO の Zhang Ming 氏が 51CTO との独占インタビューに応じました。彼は 1999 年にシンガポールイノベーションテクノロジーで働いていたときに機械翻訳に関わり始めたため、この分野に関して深く独自の洞察を多く持っています。

[[223344]]

サウンドタワーのCTO、張明氏

機械翻訳の3つの主要段階: ルール、統計アルゴリズム (SMT)、ディープラーニング (NMT)

張明氏は、機械翻訳の発展の道筋は他の多くの技術と似ており、技術的な観点からは、ルール、統計アルゴリズム、ディープラーニングという3つの主要な段階に分けられると述べた。

ルール

最初の段階はルールベースのアプローチです。ルールは、言語学者が知識と言語の理解を活用してカスタマイズし、その後、コンピューター分野の専門家によって実装されます。

このアプローチの欠点は明らかです。主な理由は、ルールが網羅的ではないため、ユーザーが入力したすべてのコンテンツがカバーされることを保証する方法がないことです。ユーザーが入力したコンテンツがルールに一致すると、翻訳効果は非常に高くなります。逆もまた同様です。

スマトラ

第 2 段階は統計アルゴリズムに基づいています。翻訳分野のデータが増えるにつれて、統計的手法を使用して大量のコーパス データをモデル化するようになり、言語規則への依存から徐々に離れつつあります。

統計アルゴリズムに基づくアプローチには、実際に言語原理が含まれています。人間の認知力は、翻訳プロセス全体がどのように達成されるかを理解し、解釈することができます。

ナノメートル

3 番目のステージはディープラーニングに基づいています。現在、ディープラーニングはブラックボックスアプリケーションです。異なるモデルに従って翻訳することで最終的な翻訳効果は大幅に向上しますが、実装プロセスを現在の人間の認知に基づいて解釈することはできません。

AIセグメンテーション技術を使用して、ユーザーの視点から製品を反復する

2016年にFenyintaを設立した理由を尋ねられた張明氏は、データとNMTモデルの発展により、2015年頃にNMTがSMTを上回り、全体的な翻訳効果が大幅に向上したと述べました。 2016年には、プログラミング言語NMTが基本的に世界を席巻し、SMTは廃止され、この時期にGoogle Neural Machine Translation(GNMT)も開始されました。機械翻訳の全体的な効果により、特定のシナリオにおけるユーザーの基本的な期待を満たすことができ、関連製品の実装が可能になります。

AI技術を活用して異言語コミュニケーションの問題を解決する

上記の機械翻訳は、テキストからテキスト、中国語から日本語、中国語から英語への純粋な翻訳設定です。しかし、FractionalTower が目指しているのは、AI テクノロジーを使用して言語間のコミュニケーションの問題を解決することであり、翻訳はコミュニケーション プロセスの一部にすぎません。

張明氏は、第1世代のJuner翻訳機の応用シナリオは、誰かの声を相手が理解できる声に翻訳することだと紹介した。この一見単純なロジックの背後には、音声認識、機械翻訳、音声合成などの AI サブテクノロジーがあり、それぞれのテクノロジーを処理するには、異なるシリーズの特定の技術ポイントが必要です。

これらのAIサブテクノロジーのどれに現在欠点があるのか​​と尋ねられた張明氏は、技術的な観点から見ても、ユーザーの市場需要から見ても、決して十分ではないだろうと述べた。現時点では、すべての分野をカバーできる汎用プラットフォームは存在しません。そのため、Fenyinta は観光産業にのみ焦点を当てています。これらの AI 細分化技術を観光業界の特定のシナリオに適用して最適化し、滑らかな音声認識や音の飲み込みなどの問題を解決することによってのみ、翻訳エラーの段階的な増幅や認識エラーによる情報損失を回避し、翻訳機の全体的な理解率を向上させることができます。

ユーザーの視点から製品を改良する

インタビューの中で、張明氏は、Fenyintaは純粋に技術系の会社ではなく、製品やサービスを作る会社であると強調した。ユーザーにいかにしてより良いサービスとより良い体験を提供するかが、同社の核心である。

Juner 翻訳機は、もともと小型で持ち運びしやすいように画面なしで設計されました。その後、コミュニケーション不足の問題を解決するために画面デザインが追加されましたが、表示面ではやや不十分でした。現在使用している世代はタッチスクリーン LED LCD 画面であり、通信プロセスにおいて優れた補助的な役割を果たします。これらの製品の反復はすべて、ユーザーからの実際のフィードバックに基づいています。

次に、Fenyinta はオフラインの側面でさらに調査を行う予定です。旅行のシナリオでは、将来的には Wi-Fi や 5G がカバーしていない場所が多数あるためです。

実際のニーズに応じてバックエンドサーバーを調整および最適化する

ユーザーにサービスを提供する過程でアーキテクチャが調整されたかどうかを尋ねられたとき、張明氏は、初期段階ではバックエンドサーバーの展開を慎重に検討していなかったことを認めました。

観光業界では、販売されているすべての翻訳機を同時に使用することはできないため、ユーザーによる翻訳機の使用には通常、高い同時実行性の問題は発生しません。そのため、バックエンドサーバーの設計時にはあまり考慮せず、当時の通常の機能要件を満たすだけでした。

しかし、実際には、高同時実行の問題は発生しませんが、翻訳機のユーザーがさまざまな国や地域に分散しているため、従来のブロードバンドでは多少の困難が生じます。さまざまな国のユーザーのアクセス速度に影響が及ばないようにするために、展開に適したノードを探すことしかできません。

ここで注目すべきは、実際の展開プロセスでは、主要顧客の分布、使用状況の分布、そして日本、タイ、東南アジアなど、中国人が最も多く出現する国を組み合わせる必要があるということです。

インタビューの最後に、張明氏は、汾銀塔は今後も観光産業に深く根ざし、その中心は依然として、飲食、宿泊、交通、旅行、娯楽、ショッピングの6つの側面を中心に展開していくと語った。 Fenyinta はスタートアップ企業です。大企業のような豊富なリソースやブランドの影響力はないかもしれませんが、より集中しています。すべてのチームは観光分野に集中しています。彼らは真にユーザーのニーズと市場の需要から出発し、より良い製品とサービスを提供することに尽力しています。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  ロボットがすべての仕事を奪ったら、人間はどうなるでしょうか?

>>:  機械学習がサイバー脅威に対する最善の武器である理由

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

インテリジェント運転システムの欠陥解決策の詳細な分析

従来の自動車と比較して、自動運転車は、車両が乗客を安全に目的地まで輸送できるかどうかという実用的な目...

2023年の人工知能に関する6つの予測

現在の AI ブームと展望に基づいて、2023 年の AI に関して専門家が予測する 6 つの点を紹...

アルゴリズムによるレイオフによって解き放たれる「悪の花」とは?

アルゴリズムによる採用は珍しいことではありません。膨大な履歴書の審査を自動化するために AI アルゴ...

AIが独自に病気を診断できる場合、人間の医師は責任を回避できるのでしょうか?

健康診断のために病院に行くところを想像してください。診察室に入るとすぐに、看護師があなたの写真を撮り...

OpenAI、リーダーシップ争いの末に新事業GPTストアを立ち上げ

ChatGPT Team は OpenAI の Enterprise Edition 製品の小型版で...

中国の博士が127ページの論文「自然言語処理におけるグラフニューラルネットワークの初心者からマスターまで」を発表

グラフは、複雑なシステムを記述およびモデル化するために使用できる一般的な言語です。グラフは、構文情報...

ディープラーニングのためのテキスト前処理方法

[[432936]] [51CTO.com クイック翻訳]昨今、ディープラーニング、特に自然言語処理...

人工知能が物理学に及ぼす影響

人工知能(AI)は物理学の分野を含む多くの産業に変革をもたらしています。物理学では、AI は複雑な問...

WatsonAIOps - AIの力を活用して、IT運用の効率とセキュリティの持続可能性を次のレベルに引き上げます

情報技術 (IT) 運用管理は、ミッションクリティカルなビジネス アプリケーションをサポートするため...

Google AI はすべてを食べています!すべての公開コンテンツはAIトレーニングのためにクロールされ、プライバシーポリシーが更新されました

今後、インターネット上で公に話すすべての言葉が、Google によって AI のトレーニングに使用さ...

...

2020年のディープラーニング開発のレビュー

近年の傾向に倣い、ディープラーニングは 2020 年も最も急速に成長している分野の 1 つであり続け...

AI業界で働く人々はどうすれば失業を回避できるのでしょうか?

「人工知能によって人間が失業したわけではない。人工知能に携わる人々が先に失業したのだ」これはもとも...

C++開発におけるデータ構造とアルゴリズムの分離についての簡単な説明

Windows でプログラムを書いたことがある人なら、誰でも多かれ少なかれビットマップを使ったことが...