XLNet の作者と AMiner のコア開発者が協力し、AI でエンタープライズ セールスを強化

XLNet の作者と AMiner のコア開発者が協力し、AI でエンタープライズ セールスを強化

[元記事は51CTO.comより] 近年、多くのインターネット企業がデータ、テクノロジー、AI、組織などさまざまなミドルプラットフォームを構築しており、さまざまなミドルプラットフォームの概念についてよく耳にするようになりました。しかし、状況がどのように変化しても、集中化の核心的な目的はコストを削減し、効率を高めることであり、それは主に2つの側面に分かれています。一方では、事業間の重複部分を統合することであり、他方では、新旧の事業に力を与えることです。

最近、人工知能スタートアップ企業Recurrentの共同創業者であるCMUのコンピュータサイエンスの博士号を持つヤン・ジーリン氏と清華大学のコンピュータサイエンスの博士号を持つチャン・ユータオ氏が51CTOのインタビューを受けた。彼らは多くのことを学び、実践し、自然言語理解、音声認識、意味理解、データ分析、マイニングなどの最先端技術を使用してモデルアルゴリズム、人、データを結び付け、企業がサービスプロセスと変換結果を中核とするAI販売プラットフォームを構築することを支援することを目指している。

実際のシナリオに技術を適用する

2016年、楊志林と張宇涛は学部時代に同じ研究室に所属し、データマイニングと処理技術を研究していました。当時、彼らは開発した技術を現実のシナリオに適用したいと考え、Circular Intelligenceを設立し、エンタープライズサービス分野に重点を置き、販売およびサービス業界のコミュニケーションプロセスにAIベースの最適化とアップグレードを提供しました。

なぜ販売シナリオを選んだのかと尋ねると、販売の方がビジネスモデルに近いからだという。販売と顧客とのコミュニケーションの過程で、大量の非構造化データが生成される。本来価値のないこれらのデータは、一連の技術を通じて参考価値のあるソリューションに変えることができ、販売効率やコンバージョン品質を向上させることができる。もっと広い視点で見れば、テクノロジーを使ってコミュニケーションを可能にしたいと考えています。コミュニケーションには、企業と顧客、企業同士、Cエンドの消費者同士、オフラインのシナリオなど、さまざまな種類があります。

両社はテクノロジー分野でそれぞれ独自の強みを持っています。 Zhilin Yang 氏は、自己回帰事前トレーニング モデル XLNet の第一著者になりました。XLNet は、20 のタスクで BERT のパフォーマンスを上回り、機械による質問応答、自然言語推論、感情分析、ドキュメント ランキングなど、18 のタスクで現在の最高の結果 (最先端) を達成しました。張宇涛氏はコア開発者として、世界的に有名なテクノロジービッグデータ分析プラットフォームであるAMinerを開発しました。その製品は、BATHなどのテクノロジー大手や科学技術部などの政府系科学研究管理機関に提供されています。

学んだことを応用してAI販売プラットフォームを構築する

現在までに、Circular IntelligenceはZhen Fundが主導し、GSR Ventures、Jingya Capital、Huashan Capitalが参加したシリーズA資金調達を完了しています。同社は以前にもGSR Ventures、Jingya Capital、Huashan CapitalからPreAラウンドの資金調達を受けており、半年間で総資金調達額は数千万ドルに達しています。同社は依然として販売と顧客間のコミュニケーションに重点を置いていますが、成熟した製品で構成されたクローズドループソリューションを備えています。

下図は、循環型インテリジェンスの実装例です。AI販売ミドルプラットフォームは、販売側で最適なリードをマッチングし、顧客側でポートレート分析とマイニングを実行できます。また、本格的なオムニチャネルの販売品質検査も実行できます。

では、このような実際のケースではどのような技術的サポートが必要なのでしょうか?当然のことながら、自然言語理解、セマンティクス、トーン、声紋認識、推奨システムなど、NLP は不可欠です。

以下は、Loop Intelligence が自社開発した音声製品とアーキテクチャの紹介です。次の図に示すように、自社開発したエンドツーエンドの認識エンジンのアーキテクチャ図です。

営業と顧客間のコミュニケーション音声は、認識エンジンを通じて独自の認識結果を取得し、継続的な試行錯誤を通じて最終的に正しい結果を得ることができます。

下の図は、コンテキストベースの意味理解ポートレートモデルです。

楊志林氏と張宇涛氏は、キーワードベースの品質検査モデルと肖像抽出モデルでは、多くの品質検査項目で誤検出や漏れが多く発生すると述べた。再帰型インテリジェント品質検査モデルは、TFIDFと単語ベクトルに基づいてシードキーワードを音声検索エンジンに入力し、類似した単語の意味とセマンティクス(Mention)を見つけます。同時に、高頻度語分析を通じて品質検査項目に類似した単語を取得し、漏れ率を低減します。ルールエンジンでまとめられる提案はルールエンジンにまとめられ、ルールで網羅できない提案については、ディープラーニングによるテキスト分類により、文脈の意味を理解して品質検査項目に該当するかどうか判断し、誤報率を低減します。

下の図に示すように、これは簡単にスケーラブルな分散 AI アーキテクチャです。

音声分析タスクの優先スケジューリング メカニズムを採用し、優先度の高いタスクのリアルタイム処理を保証します。分散音声および意味解析エンジンの使用により、コンピューティング リソースの弾力的な拡張が可能になり、データ処理能力はコンピューティング リソースに応じて直線的に増加します。インテリジェントなタスク スケジューリング管理を使用して、音声認識タスクの最適なアセンブリを実現し、GPU コンピューティング リソースの使用を最大化します。この方法により、音声認識の速度を 3 倍に向上させることができます。

独立した知的財産権を持つこの音声認識エンジンは、オリジナルの Transformer-XL ネットワーク アーキテクチャに基づいていますが、音声からテキストまでのエンドツーエンドの学習を実現できます。しかし、特にリアルタイム音声認識製品において、ハードウェアコストをどのように削減するかは、依然として技術的な課題です。コストを圧縮できれば、多くのシナリオで需要を解き放ち、リアルタイム処理を今すぐ実行できますが、コストが高すぎるため、それを受け入れられる顧客はほとんどいません。

AIセールスプラットフォームのコア競争力:モデルアルゴリズム、人、データの連携

業界のカスタマイズについて尋ねると、生データから最終価値までのチェーン全体が生産ラインであると述べました。この生産ラインは、新しい業界の量産基準に基づいて構築され、その後、新しい業界のデータと業界に関するある程度の理解をシステムにインポートします。このプロセスに標準担当者が参加することで、データから価値までのプロセスが自動的に完了します。

本質的には、非構造化データを最下層で構造化して、生産ライン全体の中核価値を実現すること、つまり、音声であれテキストであれ、非構造化データを分析可能な構造化データに変換する生産ラインのセットを提供することです。

下の図に示すように、人も生産プロセスにおいて非常に重要なノードです。

すべての知識は人を通じて入力され、標準プロセスに統合されます。人がシステムを調整して各業界に合わせてカスタマイズし、システムに人を組み込むため、カスタマイズというものは存在しません。

また、自然言語理解の面では、世界をリードする自然言語理解アルゴリズムXLNetを適用し、正確な自然言語理解を実現し、コミュニケーション対話データの精密なポートレートマイニングと音声分析を行い、その精度は従来の方法を大きく上回っていると紹介した。ディープラーニングをベースに独自に開発したレコメンデーションシステムは、コミュニケーションデータから構造化された豊富なポートレートを抽出し、XLNetなどのディープラーニング手法と効果的に統合します。従来の行動データに加えて、情報密度が高くパフォーマンスが優れている通信データが導入されました。

結論は:

AI技術を実際の製品に実装する際の難しさについて尋ねられたヤン・ジーリン氏とチャン・ユータオ氏は、AIモデルは主に効果レベルに焦点を当てており、より高い精度や再現率をいかに達成するかが問題であると述べました。実装時には、コスト、サーバー、高並行性、高スループットなど、エンジニアリングシステムにおけるより高いパフォーマンスの考慮事項をいかに得るかも問題です。非構造化データを構造化し、膨大なテキストデータ内のノイズを除去して、実際のビジネス構造に関連付ける方法も課題です。

競合他社について尋ねられた楊志林氏と張宇涛氏は、競合他社は主に、標準化されたAPIインターフェースを提供できる大企業、伝統的な業界でマーケティングに従事する2B企業、AI販売ミドルオフィスプロジェクトを行うように変革したロボット企業の3つのカテゴリーであると述べました。

《インタビュー対象者プロフィール》

Zhilin Yang: Loop Intelligenceの共同創設者、製品およびAIの責任者。以前はFacebook AI ResearchとGoogle Brainに勤務し、チューリング賞受賞者と共同で論文を発表。彼が発明したアルゴリズムは、30以上の標準AIタスクで世界1位を獲得。XLNetの第一著者であり、Alibaba Tianchi Recommender System Competitionで2位、Nvidia Pioneer Research Awardで2位を獲得。2017-2018 NLP No.1リストに選ばれた世界3人のうちの1人。ヤン・ジーリン氏は、アップルのAI責任者ルスラン氏の指導の下、2015年に清華大学で学士号を取得し、2019年にカーネギーメロン大学で博士号を取得した。

Zhang Yutao: Circular Intelligence の共同創設者兼 CTO。清華大学でコンピュータサイエンスの博士号を取得し、清華大学コンピュータサイエンス学部の副学部長であり、データマイニングの第一人者である唐潔教授に師事。コア開発者として、世界的に有名なテクノロジービッグデータ分析プラットフォームであるAMinerを開発。その製品は、BATHなどのテクノロジー大手や科学技術部などの政府系科学研究管理機関に提供されています。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  2億IoTエコシステム、人民教育新聞とAI教育で協力、天猫精霊プラットフォームレイアウトが収穫期に入る

>>:  このトレンドは止められない!すべてのデータ サイエンティストが知っておくべき 5 つのグラフ アルゴリズム

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

機械学習チートシートを使用して難しい問題を解決します。できますか?

機械学習の初心者であっても、中級プログラマーであっても、この質問に戸惑うかもしれません。チートシート...

電流制限アルゴリズムを理解すれば十分です。

TL;DR (長すぎるので読まないでください)現在の制限アルゴリズム: カウンター、スライディング...

...

AI支援ツールを使用してソフトウェア要件を定義する

Userdoc は、ソフトウェア要件ド​​キュメントの作成を支援する AI 支援サービスです。最近の...

崑崙Core2が量産開始:性能が2~3倍向上し、中国の産業知能に強力な「コア」を注入

8月18日、百度とCCTVニュースは共同で「百度ワールド2021」カンファレンスを開催し、AIが何千...

...

iQIYI機械学習プラットフォーム構築実践

機械学習プラットフォームを構築する以前、iQiyi にはすでに比較的成熟したディープラーニング プラ...

IBM TRIRIGA統合ワークプレイス管理システムに新機能が追加

IBMは、人工知能とほぼリアルタイムの洞察を活用して組織が安全で効率的かつ生産性の高い職場を構築でき...

素晴らしいクラスタリングアルゴリズムがサイエンス誌に掲載されました

著者 (Alex Rodriguez、Alessandro Laio) は、さまざまな形状のクラスタ...

Microsoft Bing Chat が GPT-4 Turbo モデルを導入、一部のユーザーは無料で使用可能

12月25日、Windowslatestによると、Microsoft Bing ChatのGPT-4...

Uni-TTS音声合成モデルのアップグレード:1つの音声、複数の言語、高忠実度、高効率

最近、マイクロソフトは最新の Azure ニューラル ネットワーク音声合成技術 Uni-TTSv3 ...

再帰アルゴリズムにおけるリンクリスト操作

今日は、問題をさらに一歩進めて、再帰プロセスに対応する操作を追加する予定です。 (免責事項: 以下の...

...