データと製品を組み合わせるトピック 1 は、データと製品の組み合わせです。Stitch Fix を例に、データ サイエンスが製品のさまざまな側面にどのように浸透しているかを説明します。 Stitch Fixは、データ駆動型の新しい衣料品小売Eコマース企業であり、ユーザーが自分に合ったスタイルを見つけるのを支援することに専念しています。主に、買い物に行く時間がなく、服装が得意ではなく、ファッションを追求したいユーザーにサービスを提供しています。 スティッチ・フィックスの売上はすべて、ブラインドボックスモデルで行われる推奨によるものだ。ユーザーは商品を受け取る前にプレビューすることができないため、どの服が気に入るかを推測する必要がある。推測が間違っていた場合、スタイリストサービスと双方向物流の実際のコストが消費されるため、精度要件は非常に高くなります。 下の図に示すように、一般ユーザーの視点から見ると、Stitch Fix の使用は主に 3 つのステップに分かれます。
Stitch Fix は、サイズ、価格、フィット感、スタイル、色など、各衣服に関するフィードバックをユーザーに提供するよう奨励しています。このデータは、データ サイエンス チームがユーザーと衣服の適合性をより深く理解するのに役立ちます。 データサイエンスチームは従業員総数の4分の1を占めており、倉庫の割り当て、ユーザーとスタイリストのマッチング、ユーザープロファイリング、人と商品のマッチング、在庫管理など、データサイエンスが製品の多くの側面に浸透し、本来の価値を発揮していることも意味します。 例 2: ユーザーとスタイリストのマッチング ユーザーがリクエストを行うと、ユーザーとスタイリスト間の取引履歴、ユーザーの評価、プロフィールのマッチングに基づいてスタイリストがマッチングされます。 例 3: ユーザー ポートレート Stitch Fix では、ユーザー ポートレートはアルゴリズムとスタイリストの両方に役立つため、人々に説明でき理解しやすいユーザー ポートレートが必要です。
ユーザー スタイルの処理では、服装スタイルをクラシック、ロマンチック、ボヘミアンなどの 7 つの次元に分けます。各ユーザーは、各次元で 1 ~ 4 のスコアを持ちます。ユーザーのスコアに基づいて、ユーザーの服装スタイルを大まかに把握できます。 例 4: 人と商品のマッチング。ここでは、主にデータとモデルの 2 つのレベルを共有します。データ レベルには、ユーザーのポートレート、製品 ID、製品の一般化機能 (画像、ラベル)、多次元フィードバックが含まれます。推奨アルゴリズムのデータには、不均衡なアイテムサンプル、データ逆流によるエラー、欠落した機能やフィードバックデータ、割引による偏差などの課題があります。モデルレベル(2016年)では、混合効果モデル、因数分解マシン、DNN、word2vec、LDAなどがあります。
上記の製品のリンクを通じて、データを使用して効率を改善し、問題を定義して解決する機会を見つけることができます。では、これを実現するためにどのようなテクノロジーが使用されるのでしょうか?ここでは、主に、測定指標の選択と分析、AB テスト、ユーザー ポートレートという、一般的な懸念事項の 3 つについて説明します。 指標の選択と分析
Stitch Fix が使用する一般的な分析には、ファネル、グループ、複数のディメンションが含まれます。次の図は、グループ分析の例を示しています。
次の図は、さまざまな顧客獲得時期におけるユーザー維持率の比較を示しています。
AB テスト Stitch Fix では、AB テストはオフライン取引によって生じる遅延とスタイリストの人的要因という 2 つの主な課題に直面しています。 オンラインアルゴリズムが変更されると、各ユーザーに合わせてスタイリストがマッチングを行う必要があり、物流と相まって 7 ~ 10 日の遅延が発生します。 スタイリストの人的要因は、主にスタイリストの慣性によって生じます。極端な例を挙げると、アルゴリズムが高額商品をプッシュしたいのに、スタイリストが中価格帯の商品をユーザーに勧めたい場合、結果に影響が出ます。 ここで注意しておきたいのは、AB テストは慎重に行う必要があるということです。次の 4 つの点に注意してください。 実験直交設計: 実験 1: 奇数で終わる UID と偶数で終わる UID 実験 2: (0,1) で終わる UID と 2 で終わる UID ユーザー適応曲線 小規模なトラフィック実験と完全なトラフィック開始の違い 実験効果の重ね合わせ: 四半期中に 6 件の +1% 実験が開始されましたが、全体的な改善はわずか 3% でした。 ユーザー ポートレート ユーザー ポートレートは、企業内の基本データの構築であり、データ ミドル プラットフォームとも呼ばれます。このポートレートは、ビジネス推奨事項、ユーザー操作、チャネル ポートレートにとって重要な指針となります。 つまり、企業内でのポートレート作成には複数の部門間の連携が必要であり、主にデータとアプリケーションの断絶、および複数のビジネス要件の類似性という 2 つの状況で課題が生じる可能性があります。実際、ポートレートを生成するには、ポートレートの要件の収集、ラベル フレームワークの構築、データの入力という 3 つのステップがあります。 実践的なプロセスで突破したい場合は、次の 3 つの提案があります。 大規模で包括的なフレームワークを放棄し、ビジネスシナリオ(価値)から逆算する ラベル(手段)を自動生成する:ルールまたはアルゴリズム 効果的なラベル管理メカニズム(持続可能性) データと人を組み合わせる2 つ目のトピックは、データと人の組み合わせです。Stitch Fix では、アルゴリズムとスタイリストを組み合わせてユーザーに服装を推奨しています。これは、人間と機械のカップリング システムと言えます。では、人間と機械のカップリング システムにはどのような課題があるのでしょうか。
人間と機械が連携したシステムでは、スタイリストが人間の役割を担い、非構造化データを処理し、1対1の感情的なコミュニケーションを行い、創造性を発揮することで、エッジケースを考慮しなくてもアルゴリズム開発を行うことができます。
さらに、人々はシーンに対してもより敏感になります。たとえば、秋になると、スタイリストは中西部の人々にどのような服が似合うかに対してより敏感になり、より良い提案ができるようになります。 人間と機械の結合では、1+1 は 2 より大きいですが、人間と機械の結合は次のような問題にも直面します。 スピードと規模のボトルネックになるのは人です。注文の分配がスタイリストの勤務時間と一致しません。 人間と機械の相互価値を測る アルゴリズムの複数のフィードバック チャネル: ユーザーからのフィードバックとスタイリストの選択 アルゴリズムの最適化目標は慎重に選択する必要がある データとチームを組み合わせる3 つ目のパートは、データとチームの融合です。このパートでは主に、データ チーム全体で分析、アルゴリズム、データ開発がどのように融合されているか、また、会社のアーキテクチャ システムの下でデータ チーム全体がビジネス チームとどのように連携しているかを紹介します。
Stitch Fix のデータ チームは、主に、データ プラットフォームとデータ ウェアハウスを構築できる基盤となるデータ開発チームと、効率性を改善したり展開ツールを作成したりするデータ サイエンティストの 4 つの部分に分かれています。 上記の3つのチームは、顧客チーム、推奨チーム、在庫チームと、それぞれの業務に1つずつ対応しています。 データ チームを構築する際に参考にしていただける 3 つの配置原則を以下に示します。 ビジネスと製品に焦点を当てます。データから真の価値を生み出す製品とビジネスに注力 特に幅広い事業を展開する企業の場合、データ サイエンス チームはインフラストラクチャ部門とビジネス部門を統合する必要があります。 会社の意思決定者からの忍耐強いサポート、そして一貫した目標を持つ特定のエンジニアリングチームと製品チームとの有機的な一体化 実際の運用では、次のような問題にも直面することに注意してください。 分析結果をどのように実装するか、実装可能な分析をどのように行うか データの分析と処理のニーズとデータ駆動型ビジネス。データ処理は受動的なものに相当します。データチームはビジネス部門のためにデータを引き出すというタスクに直面することがよくありますが、同時にデータチームが主導権を握ってビジネスを推進する必要もあります。これは、受動と能動の調整方法と考えることができます。 データ プラットフォーム チームは、データ プラットフォームの安定性を確保しながら、データ サイエンティストがデータ プロセスをより適切に管理し、コードを展開し、オンライン ツールを構築できるようにするためのツールをできるだけ多く開発しています。 |
<<: データ変換率が低いと機械学習に深刻な影響を与える可能性がある
>>: 【ビッグコーヒーがやってくるエピソード5】ビッグデータミドルプラットフォームの構築方法
[[189573]]今日の目標は、Caffe を使用してディープラーニング トレーニングの全プロセス...
アルゴリズムはプログラムの核であり、アルゴリズムの品質がプログラムの品質を決定すると多くの人が言いま...
[51CTO.com 北京レポート] 2017年8月23日から27日まで、2017年世界ロボット大会...
百度がこのほど発表した「百度人気検索・2022年大学入試ビッグデータ」レポートによると、人工知能は3...
[[208290]]概要: この記事では、海外の便利な自動データ サイエンスおよび機械学習ソフトウェ...
携帯電話に写真編集ソフトウェアがインストールされている場合は、その中の「AI ペイント」機能を使用し...
昨日、第3回世界人工知能大会が予定通り開催され、ジャック・マー氏、ロビン・リー氏、任宇新氏など国内の...
[[252582]]ビッグデータダイジェスト制作翻訳者:fuma、Ni Ni、Jiang Baos...
ビッグデータが何であるかを知っている人は多いですが、スモールデータと機械学習におけるその重要性を知っ...
ニューラル ネットワークは機械学習におけるモデルの一種です。ニューラル ネットワークは、機械学習の分...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
Cheetah Clean Master、Cheetah Browser...Cheetah Mob...