一般的に、機械学習は電子商取引の分野では、推奨、検索、広告の 3 つの主要な用途があります。今回は、これら 3 つの分野すべてに関係する商品並べ替え問題についてお話します。ビジネスの観点から見ると、一般的に目標は、リコールされた製品のコレクション内の製品を分類することによって、GMV またはクリック量を最大化することです。より具体的に言えば、トラフィックの利用効率をいかに最大化するかという 1 つの目標に基づいています。当然、各商品のGMVコンバージョン率やクリックスルー率を正確に予測できれば、トラフィックを最大限に活用し、利益を最大化することができます。 Mogujieは若い女性向けの垂直型電子商取引プラットフォームで、主に衣類、靴、バッグを扱っています。2015年の年間GMVは100億人民元を超えました。Meilishuoとの合併後、同社はMeili United Groupに改名されました。私がMogujieに入社したのは2014年、当時は機械学習の実験が始まったばかりでした。この3年間で、ヒット商品の創出、効率性の追求、品質の向上など、会社として多くの変化を遂げてきました。プロセスの中でビジネス側に課題が生じることはよくありますが、テクノロジーがビジネスに役立つという当社の理念は変わることはありません。モデル自体の反復は、その価値を最大化するためにビジネス目標と調整される必要があります。したがって、モデルの反復のルートを選択するときは、ビジネス状況を総合的に考慮する必要があります。 始める前に、いくつかの方法論について説明しましょう。クリックスルー率予測の分野では、教師ありモデルが一般的に使用されていますが、その中でサンプル、特徴、モデルという 3 つの問題は避けられません。まず、サンプルの構築方法には、モデルの目的関数、つまり何を最適化するかということが関係します。原則として、サンプルの構築は実際のシーンにできるだけ近くなることを願っています。たとえば、クリック率モデルでは、ユーザー行動ログをサンプルとして使用することがよくあります。露出したがクリックされなかったログはネガティブサンプル、クリックされたログはポジティブサンプルです。サンプルセットは、バイナリ分類を形成するように構築されます。別の類似分野であるランク付けの学習では、サンプル構築方法はポイントワイズ、ペアワイズ、リストワイズの 3 つのカテゴリに分類できます。簡単に言えば、上記のサンプル構築方法はポイントワイズカテゴリに属し、つまり、各サンプルは他のサンプルとの直接的な関係を考慮せずに構築されます。しかし、実際のシナリオでは、他のサンプルの影響を考慮する必要があることがよくあります。たとえば、Baiduでキーワードを検索すると、一連の結果が表示され、ユーザーの決定はランキング結果全体に影響されます。そのため、ペアワイズにはいくつかの改良が加えられました。そのサンプルはすべてペアで構成されています。たとえば、電子商取引の検索では、製品 a と製品 b でサンプルを構成できます。a が b よりも優れている場合、サンプル ペア {a、b} は正のサンプルであり、そうでない場合は負のサンプルです。 もちろん、これにより、a>b、b>c、c>a などの新しい問題が発生しますが、このとき私たちは何をすべきでしょうか? 興味のある学生は、「RankNet から LambdaRank、LambdaMART へ: 概要」を参照してください。リストワイズは真実に近いですが、複雑さも増します。業界ではほとんど使用されないため、ここでは詳しく説明しません。理論的には、サンプル構築方法はリストワイズ>ペアワイズ>ポイントワイズですが、実際のアプリケーションでは、この順序は必ずしも当てはまりません。たとえば、AUC が高くないなど、ポイントワイズ サンプル セットにモデルがうまく適合しない場合は、この時点でペアワイズを使用するのは意味がありません。特徴とモデルから始める必要があります。最初にペアワイズまたはリストワイズを選択するのは良い方法ではありません。 2 つ目はモデルと特徴です。異なるモデルは異なる特徴構築方法に対応します。たとえば、広告のクリック率予測モデルには通常、大規模な離散特徴 + ロジスティック回帰モデル、または小規模および中規模の特徴 + 複雑なモデルの 2 つの組み合わせがあります。たとえば、GBDT のようなツリー モデルの場合、多くの機能を離散化して相互に結合する必要がないため、機能のスケールを縮小できます。これら 2 つの方法のどちらが優れているかは一概には言えませんが、ここでは効率の問題があります。業界では、機械学習エンジニアはほとんどの時間を特徴マイニングに費やしているため、データマイニングエンジニアと呼ぶ方が適切な場合が多いのですが、これは難しく、非効率的で、再利用が難しい仕事です。これらの問題をよりきれいに解決したいという希望が、私たちが学術界からより強力なモデルを借り続ける理由です。それらのほとんどが期待に応えられなくても、私たちは決してあきらめません。 話を元に戻すと、以下のテキストは大まかに時系列順に構成されています。 ショッピングガイドから電子商取引へ Mogujie は Taobao ショッピングガイドとして始まり、2013 年に電子商取引プラットフォームに変わりました。当初、商品の分類は、運営と技術の同僚が考案した公式に基づいていました。非常にシンプルでしたが、ほとんどの問題を解決することができました。スタートアップの電子商取引プラットフォームであるため、加盟店の数と質を保証することは困難です。当時はバイヤー優先ポリシーがあり、Mogujieで販売される主な商品は同社のバイヤーチームによって手動で審査され、プラットフォームの評判がある程度保証され、プラットフォームの商品のベンチマークが設定されていました。ただし、この方法には多額の投資が必要です。このモデルのメリットを最大化するには、販売者はこれらの購入者が好む製品の運用モデルを積極的に学習する必要があります。一方、技術的な観点から見ると、システムの反復が速すぎるため、データリンクの信頼性が低下し、分散型機械学習クラスターが不足することになります。コンバージョン、クリック、GMV のパフォーマンスが良好な製品群をポジティブ サンプルとして、一定の露出があるもののパフォーマンスが低い製品をネガティブ サンプルとして選択し、簡易ランキング モデルを作成して、売れ筋モデルを作成しました。このモデルは、フォーミュラランキングと比較して、GMV を 10% 以上向上させることができます。 結果から判断すると、このモデルは依然として非常に成功しています。利点の源泉を注意深く分析すると、数式と比較して、主に関連性の高い影響要因(つまり、その特性)があり、最適化目標の下で最適な重み配分スキームを学習しています。しかし、手動で設計した数式では、要素が多すぎると難しく、重みの配分は気まぐれに決定されます。このモデルの目標は、商品がヒットする可能性を学習するという単純なものであるため、CVR や CTR などの一般的な統計機能を完了した後、モデルはボトルネックに達します。 効率を第一に、より大きく、より強くなる 2015 年までに、プラットフォームの DAU、GMV、およびマーチャント製品の数は急速に拡大し、元のモデルでは新たなビジネス上の問題が明らかになりました。まず、モデルはターゲットを大幅に簡略化し、トップ製品のみを考慮し、中程度のパフォーマンスの製品についてはほとんど差別化を行っていませんでした。次に、AUC が 95% を超えたため、モデル自体をさらに最適化する余地はありませんでした。この時点で、データ リンクと Spark クラスターの準備が整いました。業界の経験を活かして、コンバージョン率モデルの実験を始めました。 私たちの目標は、GMV を最大化することです。したがって、最も直接的な方法は、GMV 変換率をモデル化することです。露出後に取引されるサンプルは正のサンプルであり、そうでない場合は負のサンプルです。次に、正のサンプルを価格に応じて再サンプリングすることで、GMV 変換率をある程度シミュレートできます。もう 1 つのオプションは、ユーザーの購入に gmv = ctr * cvr * price という決定パスがあり、これを対数にすると log(gmv) = log(ctr) + log(cvr) + log(price) に変換できるというものです。通常、これらの目標には重み係数が追加されます。このように、問題をクリックスルー率の推定、コンバージョン率の推定に分解し、それらを合計することができます。私たちの実際の経験からすると、2 番目のソリューションの方が 1 番目のソリューションよりも優れています。主な理由は、2 番目のソリューションでは問題が小さな問題に分割されるため、モデル学習の難易度が下がることです。ユーザーが製品を購入するかどうかに影響する要因が多すぎるため、1 番目のソリューションでは後者よりもモデルに対する要件が高くなります。ただし、2 番目の解決策では複数の目標を統合する必要があり、新たな問題が発生します。 GMV 変換率に基づいて複数のモデルの結果を再度学習して融合ソリューションを取得することも、ビジネス ニーズに基づいて手動でパラメーターを割り当てることもできます。 このモデルで lr と lr+xgboost を試しました。 lr のコンバージョン率モデルは、一般的なモデルと比較して 8% 以上増加し、lr + xgboost のコンバージョン率は、lr gmv と比較して 5% 以上増加しました。ただし、LR を試したことがない場合は、まず使用して経験を積むことをお勧めします。 lr モデルでは、特徴エンジニアリングに主な取り組みを集中しました。電子商取引の分野では、機能は商品、店舗、ユーザーの 3 つのカテゴリに分けられます。特性に応じて分類できます。
一般的な特徴処理方法には、対数、平滑化、離散化、クロスオーバーなどがあります。私たちの実際の経験によると、スムージングは非常に重要です。クリックスルー率などの一部の統計的特徴では、当然ながら位置の偏りがあります。商品が十分に露出される前に、クリック率が低いからなのか、上位にランクされず十分な露出が得られていないからなのかを判断するのは困難です。したがって、CTR を平滑化することで指標の信頼性を高めることができます。具体的には、ベイズ平滑化、ラプラス平滑化、またはその他の平滑化方法を選択できます。この平滑化パラメータが大きすぎると、モデルはヒットモデルに退化し、小さすぎると、統計指標の信頼度が低くなります。現在のデータ分布に基づいて妥協する必要があります。 私たちは Facebook の gbdt+lr の経験を活用し、xgboost の事前トレーニング済みモデルを使用し、出力リーフ ノードをトレーニング用の lr モデルに入力する機能として使用しました。実際には、トレーニングおよび予測段階でのデータ分布の変化によるモデルのパフォーマンスの不安定性を回避するために、適切な正規化スキームを選択することに特別な注意を払う必要があります。このソリューションは過剰適合になりやすいため、ツリーの数を増やして深さを小さくすることをお勧めします。もちろん、xgboost にはオーバーフィッティングに対するパラメータ調整ソリューションが多数ありますが、ここでは繰り返しません。 コンバージョン率モデルが一定の結果を達成したら、パーソナライゼーションの試行を開始します。パーソナライズされたプランには 2 つの種類があります。
ラベルベースのパーソナライゼーションは、説明可能性が高く、ビジネス連携ポイントが多いという利点がありますが、カバレッジが低く、全体的な指標に明らかな改善が見られないという欠点があります。パーソナライズされた行動の粒度の利点は、高いカバレッジと詳細な説明です。オンライン化後の複数回の反復を経て、累計 GMV は 10% 増加しました。しかし、ビジネス解釈性が低く、ビジネス側がこの技術を業務に活用することが難しいという欠点があります。 当社のパーソナライゼーション ソリューションは、モデルに特徴量を直接組み込むのではなく、ソートを予備ソートと精製ソートに分割し、精製ソート レイヤーでパーソナライゼーションを実行します。この方法により、上位 N 製品のみにランキングをパーソナライズすることができ、QPS が大幅に向上します。そのため、アーキテクチャの面では、図 1 に示すように、従来の検索エンジンの上に洗練されたランキングが追加され、UPS システムはユーザー向けのリアルタイムのオフライン機能ストレージ モデルとして設計されています。 図1 パーソナライズされたソートシステムのアーキテクチャ 品質向上 全体的な環境における消費のアップグレードの到来に伴い、当社は品質の向上を戦略的な方向性としました。モデル戦略の目標は、損失を減らし、トラフィックの無駄を減らしながら、ビジネス側が目標を達成できるように支援することです。さまざまなグループの人々をガイドするプログラムを通じて、トラフィックエンドと高品質製品のエンド間の接続を確立し、グローバルコンバージョン率がわずかに低下する一方で、高品質製品のトラフィックが 40% 増加しました。全体的な設計を図 2 に示します。 図2 リアルタイムオンライン群衆誘導アルゴリズムのアーキテクチャ ユーザーフィードバックは、リアルタイムとオフラインの2種類に分かれています。オンラインクラスタリングモジュールはSpark Stream上に構築されています。ユーザーグループデータはUPSに保存されます。洗練されたソートにガイダンス戦略を追加することで、オンラインでのリアルタイムクラスタリングとユーザーのガイダンスを実現します。データフローを図3に示します。 図3 リアルタイムオンライン群衆誘導データフロー 効果の観点から見ると、ガイド付きユーザーとガイドなしユーザーの翌日の再訪問率は時間の経過とともに徐々に近づいており、解約率も時間の経過とともに減少しており、人口のグループ化が時間の経過とともに徐々に安定することを示しています。世界規模で見れば、ほとんどのユーザーはガイド可能です。 図4:翌日の再来店率 図5: 翌日のガイド付きユーザー離脱率 図6 人口割合統計 未来 最近、私たちはディープラーニングの実験をいくつか行いました。CTR 分野における Baidu の DNN 実践と組み合わせると、e コマース分野にディープラーニング技術を適用する大きな可能性があることが確認できます。さらに、電子商取引のビジネスシナリオには当然ショッピングガイドの属性があり、これを強化学習と組み合わせることができます。アリババはすでにこの点で多くの試みを行っています。これら2つの分野は、Mogujieの将来の方向性でもあります。 |
<<: テックネオテクノロジーサロン - 第14号 - アルゴリズムに基づくIT運用・保守の実践と探究
>>: こんなに高い給料がもらえる機械学習の職種の面接を受けるにはどうしたらいいのでしょうか?
[[263745]]あらゆるテクノロジーは諸刃の剣であり、人工知能テクノロジーも例外ではありません。...
[51CTO.comからのオリジナル記事] 近年、人工知能、ビッグデータ、クラウドコンピューティング...
北京速報(記者 馬金千)今朝(1月29日)、国内初となる全自動運転の新空港線列車がデバッグのために公...
ロボットが人間のように行動するためには、人間を理解する必要があります。多くの場合、それは妥協しなけれ...
人工知能はビジネス環境を一新し、競争環境を変え、仕事の本質を変革しています。しかし、人間の創造性も ...
7月27日、Microsoft Bingエンジニアリングおよび製品責任者のJordi Ribas氏は...
人工知能 (AI) と機械学習は、テクノロジーの意思決定者、業界の専門家、投資家にとって引き続き注目...
導入まず正直に言うと、しばらくの間、私はディープラーニングをあまり理解できませんでした。関連する研究...
今後 1 年間で AI テクノロジーはどのように進化するのでしょうか。組織が注目すべき主要な AI ...
2月2日、マイクロソフトのソフトウェアエンジニアリング部門のマネージャーであるシェーン・ジョーンズ...