7,000万以上の店舗と10億以上の商品を持つWeidianは、どのようにAIシステムを構築しているのでしょうか。

[51CTO.com からのオリジナル記事] AI テクノロジーは電子商取引にとって不可欠ですが、特にスタートアップ企業にとって AI を実践するためのハードルは非常に高いです。では、eコマースのスタートアップ企業はどのように AI システムを構築するのでしょうか? AI をどのように活用して実際の問題を解決できるのでしょうか?

2018年11月30日から12月1日まで、51CTO主催のWOTグローバル人工知能技術サミットが北京JWマリオットホテルで開催されました。

このサミットのテーマは人工知能です。Weidian AIの責任者である夏建氏は、業界エンパワーメントセッションでゲストに「Weidian AIの実践」に関する基調講演を行いました。

著者は、次の 3 つの側面から、Weidian の AI に関する実践の一部を紹介します。

ウェイディアンって誰ですか？
ウェイディアンAI環境
ウェイディアンAI探索事例

ウェイディアンって誰ですか？

他の多くの電子商取引プラットフォームとは異なり、Weidian は消費者に楽しく、美味しく、使いやすいさまざまな製品を提供することを目指しています。

したがって、私たちの目標は、リピーターのいるプライベートコレクションストアを作成することであり、販売者は携帯電話を通じて当社のプラットフォーム上にさまざまなマイクロストアを開設することができます。

現在、Weidian プラットフォームには 7,000 万以上の店舗と 10 億以上の製品が登録されています。当社はこれまで一貫して「ネットワーク×プラットフォーム」のビジネスモデルを通じて会社の成長を推進してまいりました。

ここで、「ネットワーク」とは、WeChat ネットワークを利用してユーザー数の増加を達成することを指し、「プラットフォーム」とは、会員制クラブプラットフォームを通じて得られる収益を指します。

ウェイディアンAI環境

現在、WeidianのシンプルなAI環境は上図のようになっています。具体的なレベルを見てみましょう:

下部には、ログ収集 (VLOG)、データベース同期 (VTS/VSS)、外部ネットワーククローラー (Spider) があります。これらのミドルウェアは、さまざまなデータソースを提供します。
中間層は、リアルタイムデータを提供するメッセージキュー (Kafka) と Weidian メッセージキュー (VdianMQ) です。同様に、オフラインデータを HDFS に同期できます。
次のレベルは、データ開発プラットフォームとアルゴリズムプラットフォームです。このうち、データ開発プラットフォームは主にデータウェアハウスと BI にサービスを提供しており、アルゴリズムプラットフォームは主にさまざまなアルゴリズムを提供して、さまざまなリアルタイムまたはオフラインアルゴリズムタスクを開発しています。
ニアラインまたはリアルタイム環境では、主に Spark Streaming、Storm、Flink、Python を使用します。もちろん、最近、Storm 関連のコンテンツをすべて Flink に移行する予定です。オフラインコンピューティングでは、データウェアハウスや BI 用の Hive や Impala などのクエリエンジンと、Spark タスクを実行するためのクラスターを使用しました。現在、Spark タスクのほとんどは Scala で記述されていますが、もちろん従来の MapReduce タスクもいくつかあります。
最上位層はデータ中間プラットフォームです。そのうち、GDS は Weidian の統合ストレージシステムであり、オープンソースの Key-Valuepair ストレージ、HBase、および Redis (メモリキャッシュ) をカプセル化します。 ES はデータサービスを提供します。部門に VIO レポートサービスを提供する必要性を考慮して、LIGO で Impala クエリエンジンをカプセル化するだけで、オフラインまたはニアラインのデータクエリを実現できます。

ウェイディアンAI探索事例

上図に示すように、Weidian AI では多くの探索作業を行ってきましたが、これは大まかに次の領域に分けられます。

ビジネス面。内容: ユーザーの意図の理解、関連性のモデリング、推奨事項の内容、クリックスルー率とコンバージョン率の見積もり、広告の最適化などのクリエイティブなコンセプト。
画像カテゴリ。これらには、コンテンツ、推奨、検索、並べ替えのサービスを提供するリスク管理、画像検索、セマンティックタグ抽出機能が含まれます。さらに、画像品質スコアやテキスト認識機能も含まれます。
ユーザーのポートレート。これには、ユーザーの好みの分析、群衆属性のマイニング、位置情報サービス (LBS、つまりユーザーの携帯電話の位置情報の取得)、ユーザーベースの製品ポートレート、およびユーザーライフサイクル管理が含まれます。
データマイニング。カテゴリ予測、構造化データ、SPU (標準製品単位) の構築が含まれます。
自然言語処理 (NLP)。含まれるもの: 単語分割、エンティティ認識、テキスト分類、単語ベクトルモデルなど。

いくつかの簡単な事例を通して、Weidian の AI 研究についてご紹介します。

画像ストリーミングコンピューティング

画像のストリーミングコンピューティングでは、一連の反復プロセスを実行しました。

初期段階では、さまざまなディープラーニングフレームワークを採用し、Python と C++ 言語を使用して、画像関連の計算の一部を単一マシンの GPU 上でのみ実行しました。
次に、バッチコンピューティング用に GPU 上の Hadoop クラスターを使用するように改善しました。
さらに調査を進めた結果、Kafka を介してさまざまなタスクを連続して接続し、結果や画像を Hbase に保存するという 2 つのビッグデータコンポーネントに基づくほぼリアルタイムのコンピューティングソリューションにアップグレードしました。具体的なプロセスは、画像処理リクエストを受信した後、Hbase でさまざまな比較を実行するか、単純な URL とハッシュの重複排除を実行します。処理が必要であると判断されると、イメージがダウンロードされて Kafka キューに追加され、アルゴリズムモデルが予測を行います。もちろん、これは実際には多段階の反復プロセスです。前のステップの結果が Kafka キューに追加されて消費された後、計算されて同様のプロセスのために別の Kafka キューに追加されます。最後に、システムは計算された結果を Hbase に保存します。これはより実用的なアーキテクチャであることがわかります。

今日のモバイル e コマース時代では、画像のプレゼンテーションの効果は消費者のショッピングの決定に大きな影響を与えます。同時に、画像自体の性質についても非常に厳しく管理しており、禁止されているコンテンツは掲載できません。そこで、この点について以下のような調査を実施しました。

画像品質スコア

前述のとおり、当社は販売者が携帯電話を通じて WeChat ストアを開設できるようサポートしています。これにより、ストア開設の敷居が下がるだけでなく、ユーザーも写真を撮ってアップロードするだけで商品を簡単に作成できるようになります。

ただし、これには次のような課題も伴います。

写真データの量は膨大です。当社のシステムにはすでに 10 億を超えるアイテムが登録されており、その数は毎日数百万、あるいは数千万単位で増加しています。
画像の品質は異なります。携帯電話の写真撮影の限界により、各種写真の品質は、TaobaoやJD.comなどの強力な電子商取引プラットフォームの品質に比べてはるかに劣っています。

したがって、上記のような強い主観的要因を考慮すると、画像の品質機能を手動で設計することは困難です。そこで、私たちは業界の一般的な慣行を参考にして、全員に採点してもらい、平均を取ることにしました。

従来のランキング SVM アルゴリズムは、主に検索結果を並べ替え、テキストの品質をランク付けするために使用されます。そこで、この考え方を独自のモデルに適用して、2 つの画像の品質を判断しました。

私たちの設計は、フロントエンドで Siamese CNN を使用して高度に抽象的な機能をトレーニングし、その機能を Ranking SVM に「フィード」してスコアを取得することです。

ここでの結合 CNN は同じパラメータを持つ 2 つのパスで構成されており、写真の品質を 0/1 分類問題に変換します。

パフォーマンスに関しては、LIVE In the Wild Image Quality Challenge Database のさまざまな公開ベンチマークデータセットのパフォーマンス結果を以下に示します。当社の WeidianIQA が最高スコアを獲得していることがわかります。

もちろん、ここでの LIVE In the Wild データセットは数千に過ぎません。最近、Google は数十万のデータの分類問題を解決するための新しい方法を提案しました。私たちも引き続き注目し、勉強を続けています。

一方、ストリーミングコンピューティングでは、特に密輸品の画像の場合、陽性サンプルと陰性サンプルの間に極端な不均衡があり、コスト効率も悪くなります。

そこで、高精度と高再現率を両立するために、アルゴリズムモデル側ではカスケードモデルの組み合わせを採用しました。具体的な計画は次のとおりです。

まず、すべての画像を軽量の粗いスクリーニングモデルに通します。これにより、禁止されている画像や、見つける必要のある特徴のほとんどがフィルター処理されます。もちろん、粗いスクリーニングモデルの精度は低くなります。
次に、以前の結果を後続の高精度モデルに「フィード」して、精度を確保します。

コスト効率を確保するためには、上記のモデルは軽量である必要があることに留意してください。「重い」場合は、写真の約 10% にのみ影響する可能性があります。

製品カテゴリー予測

PC 向けの包括的な電子商取引プラットフォームでは、製品カテゴリの予測は構造化された情報の基礎となるため、非常に重要かつ不可欠です。

これらのカテゴリは構造レベルが異なります。たとえば、衣料品には 5 ～ 6 レベルのサブカテゴリがある場合がありますが、携帯電話の SKU は非常に限られています。したがって、これは商品量の配分における重大な不均衡に直接つながります。

同様に、モバイル WeChat ストアでも、商品タイトルが整理されていない状態になります。

上記の状況に対応して、3 つのアルゴリズムの反復を実行しました。

バージョン 1: ルール + ナイーブベイズ統計
バージョン2: 従来の機械学習モデル、つまり最大エントロピーモデルを使用する
バージョン3: BiLSTM-Attentionモデル、現在のバージョン

上の図は、3 つのバージョンの精度も示しています。ここでは、100% の再現率で達成された結果を参照します。現在、自然言語処理においてはディープラーニングによる急速な進歩が見られ、我々はさらなる精度向上を目指してBERTモデルの研究を行っています。

上の図は、従来の SVM モデルである予測フローチャートです。システムはまず、入力が書籍であるかどうかを判断します。それが本でない場合は、前述の BiLSTM-Attention モデルである第 1 レベルのカテゴリ分類器に入ります。

すでに 1,000 万のトレーニングコーパスがありますが、これでは十分ではありません。そのため、シャッフルとランダム破棄の方法を使用して、トレーニングコーパスをさらに増やしました。

第 1 レベルのカテゴリの決定が完了した後も、従来の分類器である最大エントロピーモデルを使用して、対応するリーフカテゴリを決定します。

上記のカテゴリ予測の試みに加えて、Tensorflow も導入しました。当社のディープラーニングフレームワークは、上位レベルの API をラップするだけで、アルゴリズムエンジニアが新しいアルゴリズムを実装し、迅速な反復を実行できるように効果的にサポートできます。さらに、クエリの拡張やさまざまな推定もここに関係します。

ユーザープロフィール

ユーザーの特徴を抽出し、より正確にユーザーポートレートを提供するために、売り手と買い手の情報をさまざまな次元で分類しました。ユーザー属性の基本的な静的特性に加えて、これには次のものも含まれます。

ユーザーライフサイクル管理
群衆の好みの属性（例：有名人のファンかどうか、流行のブランドが好きかどうか、グルメかどうか）
地理的位置（例：通常の住所、行政区分、農村部/都市部）
ショッピング属性（購入サイクル、海外での購入かどうかなど）
社会的関係
社会的アイデンティティなど

私たちは、インターネット、特にWeChatを通じてユーザーの増加を達成し、彼らの社会的サークルやその他の特徴的な情報を理解することを望んでいます。

これまでの AI 環境アーキテクチャと比較すると、上図に示すユーザーポートレートのアーキテクチャは比較的シンプルです。関連するコードは Scala を使用して開発しました。

具体的なレベルは次のとおりです。

計算レイヤー。オフラインでの使用のために、主にいくつかの Spark タスクを作成しました。リアルタイムでの使用のために、いくつかの Flink タスクを作成しました。もちろん、GraphX と MLlib も使用しました。リアルタイムタスクとオフラインタスクのロジックを可能な限りシンプルにし、保守しやすくするために、オフラインとリアルタイムの統合を実現する汎用ライブラリを Scala で作成しました。
ストレージ層。 Weidian の統合ストレージシステムとして GDS を使用しています。ES を使用して外部サービスを提供できるほか、永続ストレージに「フォール」して Hive テーブルに配置し、運用や BI で使用することも可能です。
中間層を照会します。主にクエリ要件をカプセル化するために使用されます。

上の図は計算ロジックの一部を示しています。ユーザーの基本属性情報と行動の好みを統合するために、1 回限りの分析を通じてユーザー識別子のマッピングを取得します。

注目すべき点は、ユーザー関連情報を持つ別のアプリとは異なり、WeChat 環境からログインするユーザーの場合、サイレントログインの ID しか取得できないこと、また、閲覧ユーザーの場合、その情報は匿名であることです。したがって、適切な識別設計を考慮し、さまざまなログイン状態の切り替え動作をマッピングする必要があります。

一方、ユーザーの製品を予測するのは、前述のカテゴリ予測よりも簡単です。閲覧、クリック、カートへの追加、購入のトレーニングデータを計算し、製品嗜好モデルを導出して、購入行動を予測します。

アルゴリズムデータ層の統一

現在、業界では、レコメンデーションフレームワーク、検索フレームワーク、広告フレームワークなど、企業のすべてのフレームワークを統一して、汎用性を高め、さまざまなビジネスシナリオをサポートするという傾向があります。

上の図に示すように、さまざまなリクエストがランキングモジュールに入ると、RankPlugin サーバーはさまざまなビジネスロジックを識別し、さまざまな推奨、検索、広告のニーズを区別します。

それに応じて、統一されたアルゴリズムデータ層も装備されており、GPS によって統一されたデータストレージが実現されます。スタッフが不足しているスタートアップ企業の場合、統一されたアーキテクチャによってシステムの迅速な反復が可能になることがわかります。

リコール層、ランキング層、戦略層のいずれであっても、アルゴリズムエンジニアが新しいアイデアを思いついたら、統一された結果を通じて AB テストを実施し、オンライン結果を迅速に得ることができます。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<: ディープフェイク動画が急速に広まっている。ブロックチェーンがこの「疫病」を阻止できるかもしれない

>>: 自動運転のスケールアップ問題

7,000万以上の店舗と10億以上の商品を持つWeidianは、どのようにAIシステムを構築しているのでしょうか。

ウェイディアンって誰ですか？

ウェイディアンAI環境

ウェイディアンAI探索事例

画像ストリーミングコンピューティング

画像品質スコア

製品カテゴリー予測

ユーザープロフィール

アルゴリズムデータ層の統一

10年後には自動運転車が普及するでしょうか？

コードのスキャン、顔認識、人工知能、「インターネット+」...デジタル中国はあなたと私の人生を変えます！

世界を理解する、最新のレビューは自動運転の新しい時代を開く

技術革新により、AI人材が全国各地で活躍できるようになった

AlphaGoの仕組み：マルチエージェント強化学習の詳細な説明

AIと機械学習の品質保証

アナーキストとの対話: ノーム・チョムスキーが語るディープラーニングの未来

C# のデータ構造とアルゴリズムにおける線形リストの構築クラスの簡単な分析

推薦する

プログラマーが知っておくべき10の基本的な実用的なアルゴリズムとその説明

OpenAIはGPT-4が怠惰になったことを認める：当面修正することはできない

ビジネスリーダーがLLMを活用して新たな機会を創出できる5つの方法

AIは単なる機械学習ですか?機械学習とは何かを3000語でわかりやすく説明します

サイバーセキュリティにおける人工知能の役割と6つの製品オプション

今後 20 年間で、人工知能ロボットが介護士に取って代わり、高齢者の世話をすることになり、介護士よりも信頼できる存在になるでしょう。

20B大型モデルの性能はLlama2-70Bに匹敵します！完全にオープンソースで、ベースからツールまですべてが明確に整理されています

投票の未来: AI、ブロックチェーン、生体認証

機械学習の7つのステップ

人工知能による影の検出と除去、反射に基づく影の検出と除去方法を実現

ロボットコーチ＋模擬運転、焦作全通自動車学校が運転訓練の先駆者

負荷分散アルゴリズムを理解していますか?