かわいい子犬や遊び好きな子猫を見るのが好きな人はいないでしょうか?特に、新型コロナウイルス感染症のパンデミックの影響で世界が完全に孤立しているこの時期、私たちは気分を調整するためにもっと楽しい動画を必要としています。 しかし、これだけではDouyinがなぜこれほど支持を得たのかを説明するには不十分だ。わずか2年足らずで、わずか数人のファンしかいなかった「リップシンク」アプリから、今年は月間アクティブユーザー数が8億人近くに達する「バイラル」アプリへと成長した。 「コロナウイルス」のタグが付いたTikTok動画でさえ、アプリ内で530億回再生されている。 ▲TikTokは2020年1月に米国で最もダウンロードされたアプリとなった ▲ TikTok グローバルダウンロード数 Tik Tokの最も注目すべき特徴は、さまざまな洗脳ソングと面白いパントマイム風の短編動画です。 ユーザーは平均して1日52分をアプリに費やしているが、Snapchatでは26分、Instagramでは29分、Facebookでは37分となっている。 ▲ Oberlo 使用時間レポート さらに、60秒の短い動画のみをサポートするこのアプリには、ミーム、コメディ、ダンス、そして数え切れないほどの才能あるユーザーが集まっています。業界で最も強力な推奨エンジンの 1 つにより、検索したり特定の要求をしたりすることなく、自分の好みに合ったコンテンツをすばやく見つけることができます。ワンクリックで、エンジンがあなたに合わせた提案を生成します。 この終わりのない高速な刺激は、リラックスして楽しいユーザー体験をもたらし、最終的にユーザーを中毒にさせます。 「Tik Tokでは5分が経過したように感じるが、実際には1時間経過している」と言って、Tik Tokを究極の時間浪費キラーと呼ぶ人もいます。 本日の記事では、Tik Tok が機械学習技術を使用してインタラクティブなメカニズムを通じてユーザーの興味や好みを分析し、それに基づいてユーザーにさまざまなパーソナライズされた推奨コンテンツを表示する方法について説明します。 推奨エンジンは、データ サイエンス コミュニティにとって目新しいものではありません。しかし、画像認識や言語生成といった最新の目を引く「特殊効果」が欠けているため、多くの人はそれを従来の AI システムとして分類する傾向があります。 それにもかかわらず、推奨エンジンは依然として重要なタイプの AI システムであり、ほぼすべてのオンライン サービスとプラットフォームに存在しています。 YouTube 動画のおすすめから、Amazon から送信される広告メール、Kindle 書店の人気書籍まで、すべては推奨エンジンのおかげです。 ゴメス・ウリベ氏とNetflixのストリートレベルエンゲージメント責任者ニール・ハント氏が発表した研究論文によると、パーソナライゼーションとレコメンデーションの相乗効果により、Netflixは年間10億ドル以上の節約が可能になる可能性があるという。さらに、チャンネル登録者の 80% は、エンジンが提供する推奨リストから動画を選択します。 では、Tik Tok のユニークなスキルとは何でしょうか? 1. レコメンデーションエンジンについて [レコメンデーションエンジンの基本的な概念をすでに理解している場合は、次の章を直接読むことができます] インターネット上にはレコメンデーション エンジンに関する記事やオンライン コースが多数あるため、ここでは関連する学習リソースへのリンクを 2 つだけ紹介します。
これらの必要な基盤に加えて、産業グレードの推奨エンジンでは、完全な統合を実現するために強力なバックエンドとアーキテクチャ設計も必要です。いくつか例を見てみましょう。 ▲ レコメンデーション エンジン (Catherine Wang 作成、著作権所有) リアルタイム システムには、さまざまなビジネス上の問題を解決するために、強固なデータ基盤 (収集と保存用) が必要であり、最上位の複数の抽象化レイヤー (アルゴリズム レイヤー、サービス レイヤー、アプリケーション レイヤー) をサポートする必要があります。 2. Douyinレコメンデーションシステムのプロトタイプ設計 「ユーザー中心設計」はDouyinのプロトタイプの中核です。簡単に言えば、TikTok は現在のユーザーが好むコンテンツのみを推奨し、アプリがコールドスタートされた瞬間からユーザーの好みを追跡して強化し続けます。 ダンス ビデオをクリックすると、システムは最初にユーザーの好みをエンターテイメントに合わせてカスタマイズし、その後もユーザーの行動を追跡してさらに分析を続け、最終的にはユーザーの好みと非常に一致する正確な推奨事項を提供します。 大まかなワークフローについてお話ししましょう。 ▲ 3 つのコア コンポーネント (Catherine Wang 作成、著作権所有) Douyin のプロトタイプ システムには、1) コンテンツのタグ付け、2) ユーザー プロファイルとユーザー シナリオの作成、3) 推奨アルゴリズムのトレーニングと提供という 3 つのコア コンポーネントが含まれています。 以下では、これら 3 つのコンポーネントについて詳しく説明します。 2.1 データと機能 まず、データです。推奨モデルをより正式な言葉で説明すると、これは実際にはユーザー満足度を「ユーザー生成コンテンツ」と一致させる機能です。この目標を達成するには、3 次元からデータを入力する必要があります。
関連データを収集した後、システムは 4 種類の主要なエンジニアリング機能を導き出し、推奨エンジンに入力します。
2.2 隠された目標 レコメンデーション モデルでは、クリックスルー率、視聴時間、いいね、コメント、再投稿はすべて明確で定量化可能な目標です。モデルやアルゴリズムを使用してこれらの指標を適合させ、最終的な予測を行うことができます。 しかし、これに加えて、これらの定量化可能な指標では評価できない暗黙の目標も存在します。 たとえば、健全なコミュニティとエコシステムを維持するために、Douyin は暴力、詐欺、ポルノ、噂に関連するコンテンツの管理に力を入れており、プラットフォームに投稿されるコンテンツが事実に近づくように努めています。 2.3 アルゴリズム 推奨目標は、古典的な機械学習の問題として指定でき、その後、協調フィルタリング モデル、ロジスティック回帰モデル、分解マシン、GBD、ディープラーニングなどのさまざまなアルゴリズムを通じて問題を解決できます。
▲協調フィルタリングの模式図 産業グレードの推奨システムでは、多くの場合、さまざまなモデルを迅速にトレーニングし、さまざまなモデルを積み重ねてリアルタイム サービスを実現するための実験的なパイプラインを構築するために、柔軟でスケーラブルな機械学習プラットフォームが必要になります。 (強化学習、DNN、SVM、CNNの組み合わせなど) Douyin では、メインの推奨アルゴリズムに加えて、コンテンツ分類アルゴリズムとユーザー嗜好アルゴリズムもトレーニングする必要があります。次に、Douyin がコンテンツ分析を実装するために確立したマルチレベル分類アーキテクチャを見てみましょう。 ▲ 多段階分類ツリー(Catherine Wang 作成、著作権所有) メインルートから始めて、レイヤーごとに下へ進んでいきます。まず、メインカテゴリとサブカテゴリがあります。独立した分類器と比較して、このマルチレベル分類メカニズムは、データの偏りの問題をより適切に解決できます。 2.4 トレーニングの仕組み Douyin はリアルタイムのオンライン トレーニング プロトコルを使用しているため、コンピューティング リソースの要件が少なく、より迅速なフィードバックを提供できます。これら 2 つの点は、ストリーミング メディアや情報フロー製品にとって間違いなく非常に重要です。 トレーニング システムは、ユーザーの行動とアクションをリアルタイムでキャプチャし、モデルにフィードバックして次の応答に反映させます。 (たとえば、新しいビデオをクリックすると、フィードは最新のアクションに基づいてすぐに変化します) 私の個人的な推測によると、Tik Tok はクリック、表示、お気に入り、いいね、コメント、共有などのリアルタイムのサンプルデータを処理するため Storm Cluster を使用する可能性が高いようです。 また、システム パフォーマンスをさらに向上させるために、モデル パラメーター サーバーおよび機能サーバー (それぞれ機能とモデルを保存) も構築しました。機能ストレージは、数千万の生の機能とエンジニアリング ベクトルを保存して配信できます。一方、モデル ストレージは、モデルと調整されたパラメーターの保守と配信を担当します。 ▲ オンライントレーニングの仕組み(簡易版)(作成者:Catherine Wang、著作権所有) 以下にトレーニング プロセスをまとめます。1) オンライン サーバーがリアルタイム データをキャプチャして Kafka に保存します。2) Storm Cluster が Kafka データを使用して機能を生成します。3) 機能ストアが新しい機能と推奨タグを収集し、それらに基づいて新しいトレーニング セットを構築します。4) オンライン トレーニング パイプラインがモデル パラメーターを再トレーニングし、モデル ストレージにパラメーターを保存します。5) クライアント推奨リストが更新され、新しいフィードバック (ユーザー操作) がキャプチャされ、サイクルが再び開始されます。 3. Tik Tokのレコメンデーションワークフロー TikTok は、そのコアアルゴリズムを一般の人々や技術コミュニティに公開したことはありません。しかし、同社が公開した散発的な情報と、オタクコミュニティがリバースエンジニアリングを通じて見つけた手がかりから、私たちは当初、次のような結論を導き出しました。 (免責事項 - 以下の内容は著者の個人的な解釈と推論であり、Douyinの実際の状況と異なる場合があります) ▲ 推奨ワークフロー(Catherine Wang 作成、著作権所有) ステップ 0: ユーザー生成コンテンツ (UGC) の二重レビュー システム TikTokでは、何百万人ものユーザーが毎日独自のコンテンツをアップロードしています。悪意のあるコンテンツは、単一の機械によるレビュー システムの抜け穴を見つけてすり抜けてしまう可能性が高く、アップロード数が膨大であるため手動によるレビューは非現実的です。このため、二重審査はDouyinの主な動画コンテンツ審査アルゴリズムとなっています。
ステップ1: コールドスタート Douyin の推奨メカニズムの中核は、情報フロー ファンネルにあります。コンテンツがダブルレビュー フィルターを通過すると、コールド スタート トラフィック プールに配置されます。たとえば、ユーザーの新しい動画が審査プロセスに合格すると、Douyin は 200 ~ 300 人のアクティブ ユーザーからの初期トラフィックをその動画に割り当て、コンテンツがユーザーに表示される最初の機会を確保します。 この仕組みにより、新しいクリエイターは、オピニオンリーダー(すでに何千人ものフォロワーがいる場合もある)と同じ出発点からスタートし、作品の質だけに基づいて真っ向から競争することができます。 ステップ2: 指標に基づく重み付けメカニズム 初期のトラフィックのプールを通じて、私たちのビデオは何千回も視聴されており、このデータは今後さらに収集され、分析される予定です。分析で考慮される指標には、主にいいね、視聴回数、視聴完了数、コメント、フォロー、再投稿、共有が含まれます。 次に、推奨エンジンは、これらの初期指標とアカウント スコア (高レベルのクリエイターであるかどうかに関係なく) に基づいてコンテンツに重み付けを行います。 スコアリング結果に基づいて、上位 10% の動画には、さらに 10,000 ~ 100,000 件の推奨表示機会が与えられます。 ステップ3: ユーザー嗜好アンプ ステップ 2 のトラフィック プール ステージからのフィードバックはさらに分析され、システムがユーザー プリファレンス アンプを使用するかどうかを判断するのに役立ちます。このステップでは、特定のユーザーグループ(スポーツファン、ファッション愛好家など)に高品質のコンテンツを配信し、さらに強化・拡大します。 これは「何が好きかを推測する」という概念に似ています。推奨エンジンは、コンテンツとユーザー グループの最適な組み合わせを見つけるために、ユーザーの個人的な好みのライブラリを構築します。 ステップ4: ブティックトレンドプール 最終的にトレンドプールに入るコンテンツは 1% 未満です。トレンド プール内のコンテンツは、無差別にすべてのユーザーに推奨されるなど、他の動画よりもはるかに多くの露出が得られます。 追加手順: 遅延曝露 TikTok ユーザーの中には、自分のコンテンツが投稿されてから数週間後に突然大きな注目とクリック数を獲得していることに気づく人もいるかもしれません。それ以前は、視聴回数やリポスト数は比較的平均的でした。どうしたの? これには主に 2 つの理由があります。
制限: トラフィックのピーク コンテンツが情報フローの抜け穴(二重レビュー、重み付けの反復と増幅)を通過すると、作成者のアカウントは多くの表示機会、ユーザーとのやり取り、注目グループを獲得します。 しかし、研究によれば、この高露出時間枠は非常に狭いそうです。通常、この期間は 1 週間程度しか続きません。その後は、コンテンツとアカウントはすぐに古くなり、その後のコンテンツも人々の注目を集めなくなります。 なぜこのようなことが起こるのでしょうか? これは主に、TikTok がコンテンツ制作者にとってより公平な公開環境を提供し、アルゴリズムの偶発的な偏りを排除することを望んでいるためです。この設計により、推奨エンジンは特定の種類のコンテンツを優先することはなくなり、すべての種類の新しいコンテンツが新しいヒットになる可能性が平等に確保されます。 【注記】: 1. https://www.analyticsvidhya.com/blog/2018/06/comprehensive-guide-recommendation-engine-python/ 2. https://www.youtube.com/playlist?list=PL-6SiIrhTAi6x4Oq28s7yy94ubLzVXabj 【参考文献】: |
<<: ドローンのパフォーマンスはどんどん標準化されつつありますが、この4つの点はまだ改善が必要です。
>>: 人民日報のYitu Zhu Longの記事:今後10年間はAIコンピューティングパワーの「スーパームーア時代」となる
生成AIについて議論するインタビューでは、懸念から驚きまでさまざまな反応がありました。そしてベンチャ...
画像スタイルの転送?声の感情移入?いいえ、それはイメージの感情的な伝達です。コンピュータビジョンの分...
今日の物語の主人公は、サンジーヴ・アローラとアニルド・ゴヤルという二人の科学者です。アローラ氏はプリ...
今日のデータ主導の世界では、AI が業界全体を変革しています。 AI は大規模なデータ分析を加速し、...
Python によるシンプルな自然言語処理この記事は、Python をベースにした簡単な自然言語処理...
TCP は、多くの問題を解決する必要があり、これらの問題により多くのサブ問題とダークサイドが引き起こ...
[[238592]] 1. はじめにサービス低下とは何ですか?サーバーの負荷が急激に高まると、実際の...
[[376661]]人間は知識を獲得する過程で、物事の本質にますます注意を払うようになります。人工知...
最近、ロボットが人気になってきました。家庭生活、ホテル経営、学校教育、医療などさまざまな場面でロボッ...