[51CTO.com からのオリジナル記事] AI テクノロジーは電子商取引にとって不可欠ですが、特にスタートアップ企業にとって AI を実践するためのハードルは非常に高いです。では、eコマースのスタートアップ企業はどのように AI システムを構築するのでしょうか? AI をどのように活用して実際の問題を解決できるのでしょうか? 2018年11月30日から12月1日まで、51CTO主催のWOTグローバル人工知能技術サミットが北京JWマリオットホテルで開催されました。 このサミットのテーマは人工知能です。Weidian AIの責任者である夏建氏は、業界エンパワーメントセッションでゲストに「Weidian AIの実践」に関する基調講演を行いました。 著者は、次の 3 つの側面から、Weidian の AI に関する実践の一部を紹介します。
ウェイディアンって誰ですか?他の多くの電子商取引プラットフォームとは異なり、Weidian は消費者に楽しく、美味しく、使いやすいさまざまな製品を提供することを目指しています。 したがって、私たちの目標は、リピーターのいるプライベートコレクションストアを作成することであり、販売者は携帯電話を通じて当社のプラットフォーム上にさまざまなマイクロストアを開設することができます。 現在、Weidian プラットフォームには 7,000 万以上の店舗と 10 億以上の製品が登録されています。当社はこれまで一貫して「ネットワーク×プラットフォーム」のビジネスモデルを通じて会社の成長を推進してまいりました。 ここで、「ネットワーク」とは、WeChat ネットワークを利用してユーザー数の増加を達成することを指し、「プラットフォーム」とは、会員制クラブ プラットフォームを通じて得られる収益を指します。 ウェイディアンAI環境現在、WeidianのシンプルなAI環境は上図のようになっています。具体的なレベルを見てみましょう:
ウェイディアンAI探索事例上図に示すように、Weidian AI では多くの探索作業を行ってきましたが、これは大まかに次の領域に分けられます。
いくつかの簡単な事例を通して、Weidian の AI 研究についてご紹介します。 画像ストリーミングコンピューティング画像のストリーミング コンピューティングでは、一連の反復プロセスを実行しました。
今日のモバイル e コマース時代では、画像のプレゼンテーションの効果は消費者のショッピングの決定に大きな影響を与えます。同時に、画像自体の性質についても非常に厳しく管理しており、禁止されているコンテンツは掲載できません。そこで、この点について以下のような調査を実施しました。 画像品質スコア前述のとおり、当社は販売者が携帯電話を通じて WeChat ストアを開設できるようサポートしています。これにより、ストア開設の敷居が下がるだけでなく、ユーザーも写真を撮ってアップロードするだけで商品を簡単に作成できるようになります。 ただし、これには次のような課題も伴います。
したがって、上記のような強い主観的要因を考慮すると、画像の品質機能を手動で設計することは困難です。そこで、私たちは業界の一般的な慣行を参考にして、全員に採点してもらい、平均を取ることにしました。 従来のランキング SVM アルゴリズムは、主に検索結果を並べ替え、テキストの品質をランク付けするために使用されます。そこで、この考え方を独自のモデルに適用して、2 つの画像の品質を判断しました。 私たちの設計は、フロントエンドで Siamese CNN を使用して高度に抽象的な機能をトレーニングし、その機能を Ranking SVM に「フィード」してスコアを取得することです。 ここでの結合 CNN は同じパラメータを持つ 2 つのパスで構成されており、写真の品質を 0/1 分類問題に変換します。 パフォーマンスに関しては、LIVE In the Wild Image Quality Challenge Database のさまざまな公開ベンチマーク データセットのパフォーマンス結果を以下に示します。当社の WeidianIQA が最高スコアを獲得していることがわかります。 もちろん、ここでの LIVE In the Wild データセットは数千に過ぎません。最近、Google は数十万のデータの分類問題を解決するための新しい方法を提案しました。私たちも引き続き注目し、勉強を続けています。 一方、ストリーミング コンピューティングでは、特に密輸品の画像の場合、陽性サンプルと陰性サンプルの間に極端な不均衡があり、コスト効率も悪くなります。 そこで、高精度と高再現率を両立するために、アルゴリズムモデル側ではカスケードモデルの組み合わせを採用しました。具体的な計画は次のとおりです。
コスト効率を確保するためには、上記のモデルは軽量である必要があることに留意してください。 「重い」場合は、写真の約 10% にのみ影響する可能性があります。 製品カテゴリー予測PC 向けの包括的な電子商取引プラットフォームでは、製品カテゴリの予測は構造化された情報の基礎となるため、非常に重要かつ不可欠です。 これらのカテゴリは構造レベルが異なります。たとえば、衣料品には 5 ~ 6 レベルのサブカテゴリがある場合がありますが、携帯電話の SKU は非常に限られています。したがって、これは商品量の配分における重大な不均衡に直接つながります。 同様に、モバイル WeChat ストアでも、商品タイトルが整理されていない状態になります。 上記の状況に対応して、3 つのアルゴリズムの反復を実行しました。
上の図は、3 つのバージョンの精度も示しています。ここでは、100% の再現率で達成された結果を参照します。現在、自然言語処理においてはディープラーニングによる急速な進歩が見られ、我々はさらなる精度向上を目指してBERTモデルの研究を行っています。 上の図は、従来の SVM モデルである予測フローチャートです。システムはまず、入力が書籍であるかどうかを判断します。それが本でない場合は、前述の BiLSTM-Attention モデルである第 1 レベルのカテゴリ分類器に入ります。 すでに 1,000 万のトレーニング コーパスがありますが、これでは十分ではありません。そのため、シャッフルとランダム破棄の方法を使用して、トレーニング コーパスをさらに増やしました。 第 1 レベルのカテゴリの決定が完了した後も、従来の分類器である最大エントロピー モデルを使用して、対応するリーフ カテゴリを決定します。 上記のカテゴリ予測の試みに加えて、Tensorflow も導入しました。当社のディープラーニング フレームワークは、上位レベルの API をラップするだけで、アルゴリズム エンジニアが新しいアルゴリズムを実装し、迅速な反復を実行できるように効果的にサポートできます。さらに、クエリの拡張やさまざまな推定もここに関係します。 ユーザープロフィールユーザーの特徴を抽出し、より正確にユーザーポートレートを提供するために、売り手と買い手の情報をさまざまな次元で分類しました。ユーザー属性の基本的な静的特性に加えて、これには次のものも含まれます。
私たちは、インターネット、特にWeChatを通じてユーザーの増加を達成し、彼らの社会的サークルやその他の特徴的な情報を理解することを望んでいます。 これまでの AI 環境アーキテクチャと比較すると、上図に示すユーザー ポートレートのアーキテクチャは比較的シンプルです。関連するコードは Scala を使用して開発しました。 具体的なレベルは次のとおりです。
上の図は計算ロジックの一部を示しています。ユーザーの基本属性情報と行動の好みを統合するために、1 回限りの分析を通じてユーザー識別子のマッピングを取得します。 注目すべき点は、ユーザー関連情報を持つ別のアプリとは異なり、WeChat 環境からログインするユーザーの場合、サイレント ログインの ID しか取得できないこと、また、閲覧ユーザーの場合、その情報は匿名であることです。したがって、適切な識別設計を考慮し、さまざまなログイン状態の切り替え動作をマッピングする必要があります。 一方、ユーザーの製品を予測するのは、前述のカテゴリ予測よりも簡単です。閲覧、クリック、カートへの追加、購入のトレーニング データを計算し、製品嗜好モデルを導出して、購入行動を予測します。 アルゴリズムデータ層の統一現在、業界では、レコメンデーションフレームワーク、検索フレームワーク、広告フレームワークなど、企業のすべてのフレームワークを統一して、汎用性を高め、さまざまなビジネスシナリオをサポートするという傾向があります。 上の図に示すように、さまざまなリクエストがランキング モジュールに入ると、RankPlugin サーバーはさまざまなビジネス ロジックを識別し、さまざまな推奨、検索、広告のニーズを区別します。 それに応じて、統一されたアルゴリズムデータ層も装備されており、GPS によって統一されたデータストレージが実現されます。スタッフが不足しているスタートアップ企業の場合、統一されたアーキテクチャによってシステムの迅速な反復が可能になることがわかります。 リコール層、ランキング層、戦略層のいずれであっても、アルゴリズムエンジニアが新しいアイデアを思いついたら、統一された結果を通じて AB テストを実施し、オンライン結果を迅速に得ることができます。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
<<: ディープフェイク動画が急速に広まっている。ブロックチェーンがこの「疫病」を阻止できるかもしれない
1月12日、アリババ、AI研究所、清華大学などの共同研究チームが、新たな超大規模認知事前トレーニング...
映画やテレビ作品では、人工知能による殺人はごく普通のことのように思えますが、結局のところ、それは人間...
海外メディアの報道によると、食品・飲料業界では人工知能やモノのインターネット技術がますます頻繁に利用...
一般の人々は自動運転車についてどう思っているのだろうか?市場調査会社CarGurusは最近、将来の自...
機械学習には高い処理要件があり、通信コストがかかることから、最終的にはエッジ(スマートフォン)で動作...
[[358972]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
「ついていけない人は排除されるかもしれない」ソラのデモ動画を見て、10年以上の経験を持つアニメプロ...
近年、我が国のロボット産業は急速な発展傾向を示していますが、一方で、中核技術の弱さや粗利益率の低下な...
GPT-4 は、詳細かつ正確な画像の説明を生成する強力で並外れた能力を実証しており、言語と視覚処理...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...