[51CTO.comより引用] 2018年11月30日から12月1日まで、51CTO主催のWOT2018グローバル人工知能技術サミットが北京JWマリオットホテルで開催されました。このサミットは、AI技術が業界のアップグレードを促進するという観点から始まり、技術トレンドに遅れずについていき、現在のホットな話題に焦点を当てています。AIプラットフォームツール、アルゴリズムモデル、音声と視覚などの技術トピックをカバーし、AIの最先端理論と最先端技術の激しい衝突の知識の饗宴をもたらします。 ご存知のとおり、人工知能はコンピューティング、アルゴリズム、データという 3 つの主要要素から切り離すことはできません。データの爆発的な増加とアルゴリズムの飛躍的進歩により、人工知能は自然言語処理、画像認識、人間とコンピュータの相互作用などの分野で大きな進歩を遂げ、ほぼすべての機械支援機能を可能にしました。たとえば、スマートレコメンデーションやスマートウェアラブルなどのアプリケーションが成功裏に実装され、自動運転車や予防医療が現実のものになりつつあります。 では、企業は人工知能の応用を加速するために、どのように高度なアルゴリズムを使用すべきでしょうか。今回のWOTサミットの「アルゴリズムモデル」フォーラムでは、Triangle Technologyの副社長であるChen Huarong氏、Jietong HuashengのMTおよびNLPアルゴリズム責任者であるXing Qizhou氏、Weike Dataのアルゴリズム責任者であるLi Xiang氏が、意味理解に基づくインテリジェントなインタラクション、単なる翻訳以上のもの、新しい小売シナリオにおけるAIの実装という3つの異なるトピックについて検討し、聴衆にアルゴリズムモデルの饗宴をもたらしました。 トライアングル・ビースト・テクノロジー副社長 陳華栄氏:意味理解に基づくインテリジェントなインタラクション トライアングルテクノロジー副社長の陳華栄氏は、主に自然言語処理(NLP)技術と意味理解に基づく対話システムおよびインテリジェントインタラクションシステムの開発を紹介し、意味理解の現場実装と実践経験に焦点を当てました。 知覚知能は、見ることと聞くことの問題を解決し、外界からの情報を受け取ることに重点を置きます。知覚知能はまだ、見たり聞いたりしたものを理解することができず、もちろん、決定を下すこともできません。陳華栄氏は、システムが理解し考えるためには、システムが言語を理解して習得し、習得した知識を使って推論できるように、認知知能を備えていなければならないと述べた。現時点では、認知知能はまだ比較的初期段階にあり、推論を行うことはできません。つまり、人工知能にはまだまだ長い道のりが残っているのです。 元の自然言語では、文の構造を分析して意味を理解する従来の NLP アルゴリズムが使用されていました。言語は常に変化し、非常に複雑な性質を持っているため、NLP アルゴリズムに基づいてより優れたランディング製品を構築することは不可能でした。ディープラーニングの登場以降、音声認識や画像認識への応用が成功し、徐々に自然言語処理にも応用されてきました。陳華容氏は、局所的および全体的な特徴を捉えるのが得意なCNNを例に挙げ、ディープラーニングの利点を詳しく紹介しました。現在、業界ではディープラーニングをベースにした感情認識、テキスト分類、機械翻訳、読解、テキスト要約などがホットな話題となっていると語った。 続く講演では、陳華栄氏がスマートフォン、スマートIoT、スマートカスタマーサービスという3つの異なるシナリオの応用から始め、Triangle Beastの技術から商業応用までのプロセスを詳細に紹介しました。 Triangleの商用化には、オープンドメインチャットエンジンや汎用対話エンジンなど、さまざまな対話エンジンをスマートテレビ、スマートスピーカー、携帯電話、子供用腕時計などの端末デバイスに適用するだけでなく、感情分析、意味エラー修正、顧客サービス品質検査、コンテンツフィルタリングなどの補助機能モジュールも提供し、ユーザーにコンテンツのあいまいな意味を理解するための強力なアルゴリズムを提供すると報告されています。 Jietong Huasheng の MT および NLP アルゴリズムの責任者、Xing Qizhou 氏: 翻訳以上のもの Jietong Huasheng の MT および NLP アルゴリズムの責任者である Xing Qizhou 氏は、主にニューラル機械翻訳関連の技術とその応用について講演しました。機械翻訳、Lingyun 機械翻訳フレームワーク、Transformer モデル、翻訳用に設計されたその他のアルゴリズム、業界における翻訳製品の現状、機械翻訳の課題と将来の開発動向という 6 つの主要なトピックについて詳しく説明しました。 邢其洲氏は、人工知能、ディープラーニング、ニューラルネットワークの発展により、ニューラル機械翻訳は新たな時代に入り、特にグーグルが昨年「必要なのは注意だけ」という論文を発表して以来、機械翻訳の分野では大きな進歩が遂げられていると述べた。数年前に人気があった統計的機械翻訳 SMT から、ここ 2 年間で人気が高まっているニューラル機械翻訳 NMT まで、これらはすべて機械翻訳フレームワークです。現在、凌雲機械翻訳の枠組みは、テキストのクリーニング、大文字と小文字の変換、単語の分割などのテキスト前処理を通じて、さまざまな複雑な記号を含むノイズの多い不規則なテキストを機械処理に適した形式に変換することです。次に、固有表現認識を通じて、その文が翻訳モデルに入力され、最終的にターゲット言語の翻訳文が出力されます。 ***、再度固有表現認識を行い、テキスト後処理を経て逆復元を行い、*** ユーザーが実際に入力した形式を復元し、最後に翻訳結果を全員に提示します。 次に、邢其州氏は機械翻訳の各ステップの技術的な詳細、Jetcom Huasheng が使用した技術、遭遇した困難、経験の概要について詳しく説明しました。同氏は、機械翻訳が成熟した製品になるためには、翻訳能力そのものがどれだけ優れているかではなく、ASR技術、TTS音声合成技術、OCR技術など、さまざまな人工知能技術を組み合わせることが重要だと述べた。したがって、複数のテクノロジーの統合は、翻訳の将来の発展の傾向です。 邢其洲氏は、マルチモーダル翻訳と音声認識、多言語翻訳、マルチテキスト翻訳、段落レベル翻訳、オフライン翻訳、プライバシーに基づく翻訳はすべて翻訳の将来の発展方向であるが、いずれもコーパスの欠落という問題に直面していると強調した。現在、コーパスの強化は転移学習、教師なしまたは半教師ありの方法などを通じて行うことができますが、既存の方法ではまだ満足できるレベルに到達できません。これは将来突破する必要がある困難な問題です。 Weike Data Algorithm の責任者 Li Xiang: 新しい小売シナリオにおける AI 実装の探求 Weike Dataのアルゴリズム責任者であるLi Xiang氏は、新しい小売シナリオにおけるAI実装の探求に焦点を当てた講演を行いました。小売シナリオにはすでに多くの次元と数値がありますが、Weike Dataの最終的な目標は、眠っているデータを目覚めさせ、データを最大限に活用し、小売業者がデータを通じて顧客を管理できるようにすることだと彼は考えています。 新しい小売業についての認識について、李翔氏は、それは実は小売業をより良くするための新しい方法であると考えています。同氏は、ニューリテールをブラックボックスに例えると、その入力はデータ、出力はサービスであると述べた。その目的は、従来の小売業界が顧客に、より良い、より質の高いサービスを提供できるようにすることだ。この目標をさらに細分化すると、第一に小売業者が顧客をより深く理解できるようにすること、第二に顧客にパーソナライズされカスタマイズされた高品質のサービスを提供することです。 続く講演では、李翔氏がデータとサービスに焦点を当てて、Weike Dataの実践と経験を聴衆に詳しく紹介し、顔認識や物体認識などのデータモデルなど、その中核となるアルゴリズムの内容を共有しました。李翔氏は、新しい小売業界ではAIの応用シナリオは多岐にわたるが、まず解決すべきは「顧客は誰か」という問題だと述べた。顧客が誰であるかを知ることによってのみ、的を絞った解決策を作ることができる。 顧客が誰なのかを把握したら、次のステップはソリューションを選択することです。成熟したサードパーティ企業のソリューションを選択するか、独自のソリューションを設計するか。まず、コストを考慮し、次に、1 つのモデルだけを選択しないでください。 Weike Data は、ビデオ ストリームから顔を検出し、識別と分析のために顔を抽出する際に困難に遭遇したと報告されています。彼らは 3 つの解決策を試しました。1 つ目は通常のカメラ ソリューションで、その最大の利点は低コストでした。 2 つ目は、携帯電話のカメラ ソリューションを使用することですが、これはまだコストが非常に低いです。 3つ目は、プロ仕様のカメラソリューションを使用することです。コストは高くなりますが、得られる効果も優れています。そのため、Weike Data は最終的に 3 番目のオプションを選択しました。 Li Xiang氏は、カメラ側でビデオストリームを分析し、顔を検出し、顔をキャプチャし、その後MTCNNを介して顔のより深い抽出を実行することで、非常に低い計算コストで顔認識と詳細な分析を実現できると述べました。 上記の内容は、WOT2018グローバル人工知能技術サミットの「アルゴリズムモデル」サブフォーラムの講演内容に基づいて51CTO記者がまとめたものです。WOTに関するその他の内容については、.comに注目してください。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
<<: 強力な暗号化アルゴリズムによる SQL インジェクション事例
>>: AI開発は断片化に直面しており、ディープラーニングフレームワークの統一が必要
2024年に向けて、AI分野ではどのような発展や変化があるでしょうか? Stability AIが...
今日、AI プログラムは、写真やビデオ内の顔や物体を認識し、音声をリアルタイムで書き起こし、X 線ス...
今年の315ガラでは、いくつかの有名ブランド店が顔情報を違法に収集していたことが摘発された。これらの...
概要スイス政府コンピュータ緊急対応センター (GovCERT) は最近、Tofsee ボットネット ...
[[216302]] Leifeng.com(公式アカウント:Leifeng.com)AI Fina...
世界的な市場調査およびコンサルティング会社である Nova One Advisor は、医療画像分野...
人口の高齢化が加速し、教育に対する需要が引き続き強いことから、中国のサービスロボットは大きな市場潜在...
[[361228]]スペインは、感染者数が170万人を超え、欧州で新型コロナウイルスのパンデミック...
ガートナーは、2026年までに中国のホワイトカラー職の30%以上が再定義され、生成AIを活用し管理す...
最近、中国の国立国防科学技術大学、カリフォルニア大学ロサンゼルス校、ハーバード大学医学部の研究者らが...
[[243197]]人工知能とは何ですか?人工知能の定義は、「人工知能」と「知能」の 2 つの部分に...