YouTube 動画推奨アルゴリズムを破る方法

YouTube 動画推奨アルゴリズムを破る方法

[[176814]]

映画、ドラマ、テレビ番組、オンライン ビデオなどの配信チャネルのコンテンツ ワーカーの場合、コンテンツの成功または失敗は配信メカニズムの動作ロジックによって決まります。たとえば、テレビ番組を制作し、それを本当に人気番組にしたい場合、どこに広告を挿入するか、どのように番組を宣伝するか、どのチャンネルで放送するか、選択したチャンネルを何世帯が視聴できるかなどを知っておく必要があります。

配信チャネルが YouTube である場合、理解すべき最も重要なことは YouTube のアルゴリズムの仕組みです。しかし、アルゴリズムによって運営されている世界中のすべてのプラットフォームにおいて、これを把握するのは極めて困難です。

YouTube はアルゴリズムで使用される変数を公開していません。アルゴリズムがどのように機能するかを理解するには、たとえデータが限られていたとしても、この大きなブラックボックスの内部を調べる必要があります。アルゴリズムが依存する変数の一部(サムネイル、タイトルのインプレッション、ユーザーの訪問履歴、ユーザーの行動、セッション情報など)に関するデータがまったくありません。これらのデータを入手できれば、YouTube のアルゴリズムを丸裸にして見ることができるようになります。しかし、それは実現しませんでした。

何もないように見えますが、それでも、アルゴリズムのロジックを理解するために、持っているわずかなデータを使用したいと思っています。そこで、私の元同僚(なぜ「元」同僚なのか? というのも、私は最近 Frederator を辞めたからです)の Jeremy Rosen は、Frederator 自体が管理・運営するチャンネル データを半年かけて分析し、YouTube のアルゴリズムを解明しようとしました。

始める前に、この記事で言及されているアルゴリズムには、複数の YouTube 成長アルゴリズム (推奨、提案、関連、検索、MetaScore など) が含まれていることを明確にしておきましょう。これらの異なるアルゴリズム製品はそれぞれ焦点が異なりますが、共通点が 1 つあります。それは、最適化の目標が同じで、視聴時間であることです。

視聴時間

まず、「視聴時間」は視聴した分数を意味するものではないことを明確にする必要があります。この概念については以前にも議論しました[1]。視聴時間は以下の指標で構成されています。

  1. 訪問回数
  2. 訪問して滞在する
  3. セッション開始
  4. アップロード頻度
  5. セッション期間
  6. セッション終了

基本的に、これらの各要素は、チャンネルとその動画のパフォーマンス、ユーザーが頻繁にアクセスしているかどうか(ページビューでセッションを開始しているかどうか)、ユーザーが長時間滞在しているかどうかに関係します。

アルゴリズム内の変数の値を蓄積するには、まずあなたのチャンネルと動画に誰かが訪問する必要があります。動画が成功するには (成功とは、最初の 30 日間にチャンネル登録者の半数以上が動画を視聴することと定義されます)、公開後数分、数時間、または数日以内に多数の視聴を獲得する必要があります。これを「視聴速度」と呼びます。

アクセスとアクセス率

Frederator のアクセス率を分析したところ、ライフサイクル全体にわたる累積訪問数は、最初の 48 時間以内に訪問する加入者の割合と指数関数的に相関していることがわかりました。

48時間以内に訪問した加入者の割合と平均訪問回数

この観察に基づいてさらに深く調査したところ、この速度法則を使用してビデオが成功するかどうかを予測すると、92% の精度を達成できることが分かりました。実際、72 時間以内に訪問する登録者の割合と、動画のライフサイクル全体にわたる累積訪問数には、より直接的な相関関係があります。

72 時間以内に訪問した加入者の割合と全期間にわたる訪問回数の合計

これら 2 つのグラフと相関係数は、訪問数とアクセス率が動画やチャンネルに直接的かつ重要な影響を与えることを十分に示しています。さらに、この法則は逆の場合にも当てはまるという証拠もあります。アクセス速度が遅いと、ビデオ自体だけでなく、前のビデオや次のビデオにも影響します。

下の図は、Frederator 上のビデオのアクセス率が 48 時間以内に低い場合 (登録者の 5% 未満がアクセスした場合)、次にアップロードされるビデオも影響を受けることを示しています。

最初の 2 つの動画を視聴した登録者の平均割合に対する、次の動画を視聴した登録者の割合

このデータは、マシュー・パトリックの理論を裏付けています。つまり、動画のクリック数があまり多くない場合、YouTube は次に動画をアップロードしたときに、チャンネル登録者に見られるようにあまり重視しないということです。 [2]

また、前回の動画のパフォーマンスが悪かったためにチャンネルへの訪問者数が減少し、当然のことながらチャンネルに直接アクセスする登録者数も減少する可能性があります。 「なぜ」が何であれ、結果はこうなります。

新しくアップロードされた動画に対するマイナス評価のもう 1 つの影響は、動画ライブラリ全体にも悪影響を与える可能性があるという証拠があることです。以下の最初のグラフは、動画のアップロード後 48 時間以内にチャンネルを訪問した登録者の 7 日間の平均割合 (翻訳者注: この 7 日間に複数の動画がアップロードされ、各動画のアップロード後 48 時間以内にチャンネルを訪問した登録者の割合が記録され、これらの割合の平均が算出されました) を、チャンネルへの総訪問数 (翻訳者注: 動画ライブラリ全体のパフォーマンスを反映しています) と比較したものです。 2 番目のグラフは、特定の日に動画にアクセスした登録者数の合計と、その日の総視聴回数の割合を示しています。

「48 時間以内に動画を視聴したチャンネル登録者の割合」の 7 日間平均と、チャンネル全体の 1 日あたりの動画視聴回数の合計との関係

7日間の購読者平均訪問数と総訪問数の関係

これらのグラフからわかることは、新しくアップロードした動画や動画ライブラリ全体にアクセスするユーザーの割合が減少すると、チャンネル全体のアクセス数も減少するということです。私たちにとっての教訓は、YouTube のアルゴリズムはコアな視聴者を引き付けるチャンネルを重視し、そうでないチャンネルにはペナルティを課すということです。

訪問して滞在する

アルゴリズムが重視するもう 1 つの指標は、視聴期間です。

訪問維持率とは、ユーザーが 1 つの動画ページに費やす時間を指します。この変数は大きな重み付けがされており、データには明確な転換点が見られます。 Frederator のチャンネルの 1 つでは、最初の 30 日間の動画の平均長さが 8 分で、これは平均 5 分間の動画の 350% 増でした。次のグラフは、Frederator のチャンネルの動画訪問数と平均訪問時間の関係を示しています。

ライフサイクル全体にわたる平均訪問時間と平均訪問数の関係

ここでは、アクセス時間が 8 分を超えるデータは考慮されないことに注意してください。

また、訪問時間が長くなるほど、ビデオのパフォーマンスが向上することもわかりました。次のグラフは、7 日間の訪問回数と動画の視聴時間の関係を示しています。訪問時間は 5 分未満 (1)、5 分から 10 分 (5)、10 分以上 (10) です。

平均訪問回数と7日間の平均訪問期間の関係

下の図も同じ考え方ですが、7 日間からライフサイクル全体に拡張されています。

ライフサイクル全体における平均訪問回数と平均訪問期間の関係

これらの調査結果に基づいて、長い動画を公開すると訪問結果が向上する可能性があるという単純な結論を導き出すことができます。 Frederator には子供の遊び場に関するチャンネルがあり、毎週 3 ~ 4 本の異なる長さ (3 分、10 分、30 分、70 分) のビデオをアップロードしています。各ビデオが公開されてから 48 時間以内に、古いビデオの再投稿であっても、70 分のビデオのアクセス数が他の長さのビデオのアクセス数をはるかに上回っていることがわかりました。さらに、70 分間のビデオの平均セッション時間は他のバージョンと同じでした。

したがって、企業には 1 週間あたり 70 分のビデオのみをアップロードすることをお勧めします。この戦略を使用することで、過去 6 週間でチャンネルの 1 日のトラフィックは 50 万増加しましたが、アップロードした動画の数は 75% 減少しました。わかった、わかった、あなたが怒っているのはわかっている、私を崇拝しないで。

セッション開始、セッション継続時間、セッション終了

この研究は、私の前回の記事「WTF is WatchTime?」[1]によって可能になりました。

簡単にまとめると、セッション開始とは、ユーザーが動画から YouTube へのアクセスを開始した回数です。これは、加入者が最初の 72 時間以内にあなたにアクセスできることがいかに重要であるかを示しています。チャンネル登録者は、動画が投稿された後に最初に動画を見るユーザーであり、すでにあなたのブランドをよく知っているため、チャンネルアイコンをクリックする可能性も最も高くなります。

セッション継続時間とは、コンテンツがユーザーを YouTube プラットフォームに留めておく時間です。ユーザーは、動画にアクセスしたときとアクセス後の両方でプラットフォームに留まっているとカウントされます。平均視聴時間とユニーク視聴回数以外にこれより良いデータはありません。

セッション終了は、ユーザーが動画を視聴した後に YouTube プラットフォームを離れる頻度を測定します。これはアルゴリズムの悪用を示す否定的な指標ですが、データを取得することができません。

アルゴリズム理論

YouTube のアルゴリズムは、個々の動画のパフォーマンスではなく、チャンネルのパフォーマンスに重点を置くように設計されています。しかし、チャンネル効果を高めるために単一のビデオを使用します。

アルゴリズムは、単一の動画に固有のデータとチャンネルからの集計データを組み合わせて、どの動画を推奨するかを決定します。最終的な目標は、依然としてチャンネルのターゲット視聴者を集めることです。

YouTube がこれを実行する理由は次のとおりです。

1. ユーザーをYouTubeに呼び戻す

2. ユーザーをできるだけ長くプラットフォームに留める

以下に、この理論を証明する 3 つのグラフを示します。

最初のグラフは、48 時間以内に訪問した購読者の割合と 7 日間の合計訪問数の関係を示しています。このグラフは、動画からプラットフォーム セッションを開始するユーザーが多数いる場合、動画に多くのトラフィックが流入することを示しています。閾値に達すると、指数関数的に増加します。

7 日間の総訪問数と 48 時間以内に訪問した加入者の割合

2 番目のグラフは、チャンネルへの 1 日あたりの平均訪問数と 5 日以内に訪問した登録者の割合の関係を示しています。

1日あたりの平均訪問数と5日以内に訪問した加入者の割合の関係

つまり、訪問開始から一貫して多数のユーザーに YouTube を訪問してもらうことができれば (過去 5 日間の平均)、アルゴリズムによって毎日の訪問数がチャンネルのビデオ ライブラリ全体に傾くことになります。

*** 1 つのグラフは、平均して毎日訪問する加入者の割合と 5 日以内に訪問する加入者の割合の関係を示しています。

平均して毎日訪問する加入者の割合と5日以内に訪問する加入者の割合の関係

これらすべては、チャンネルのパフォーマンスの一貫性と訪問数の間に相関関係があり、それが登録者の訪問率に反映され、YouTube がトラフィックをあなたに向ける傾向があることを示していると考えています。

登録者数が 10 万人のゲーム チャンネルがあるとします。1 日に 6 本の動画をアップロードし、各動画は登録者の 5% に視聴されています。動画あたりの平均登録者数はわずか 5% で安定します。これは、毎日の訪問数の 30% を購読者から得ることを意味します (1 日あたり 30,000 件、1 か月あたり 600,000 件)。仮に 100 万人の登録者がいるとすると、1 日あたりの訪問数は 30 万回、つまり 1 か月あたり 600 万回になります。

この計算は嘘をつかないと思います。これは、YouTube がいくつかの指標に基づいて推奨するチャンネルを選択し、アルゴリズムがチャンネルのトラフィック増加を支援することを意味します。

しかし、勇敢な人たち、留まってください。上記は単なる理論的な分析です!

スコアリングアルゴリズム

ここでは、YouTube のアルゴリズムをハッキングして再構築します。スコアリング アルゴリズムを再構築するために、15 個のセマフォと推定重みを使用しました。セマフォは以下のとおりです。

スコアリングアルゴリズムの開発に使用されるシグナル/要因

次の図は、これらのセマフォの実際の効果を示しています。

平均アルゴリズムスコアと3日間の訪問数の相関傾向

アルゴリズムスコアと訪問数の相関傾向

下の写真はもう少し詳細です。

3日間のアルゴリズムスコア平均と毎日の訪問数

まだ興味があると思うので、シミュレーションしたさまざまな重量を以下に示します。

各種アルゴリズムの重み分布シミュレーション

視聴時間最適化アルゴリズムにおける各信号量の重み分布のシミュレーション

関連する推奨事項やその他のアルゴリズムの各シグナルの重み分布

ただし、他のデータがないため、相関を計算するときにどの回帰法を使用すればよいかはわかりません。ほとんどの信号はアルゴリズムと高い相関関係にあるとしか言えません。これが、私たちが YouTube アルゴリズムに熱心であり続ける理由です。

YouTubeのアルゴリズムについて思うこと

私たちのデータに基づいて、少なくとも 6 つの大まかな結論を導き出すことができます。

1. YouTube はアルゴリズムを使用して、動画やチャンネルのアクセス数を決定します。

2. 成功しているチャンネルは、特定の種類のコンテンツやクリエイティブに重点を置いています。

3. チャンネルがどのようなタイプのコンテンツが成功するかを判断したら、迷うのをやめるべきです。

4. コンテンツ制作者はお金だけで YouTube で成功することは決してできないので、裕福な制作者が YouTube を心から受け入れる可能性は低いです。

5. パーソナライズされた番組やチャンネルは、人々が求めている「特定の種類のコンテンツ」であるため、YouTube では常に主流のコンテンツになります。

6. 新しく作成されたチャンネルが YouTube 外からのトラフィックを引き付けることができなければ、長期的に成長することは困難になります。

前述のように、YouTube はチャンネル訪問者数の増加に重点を置いていますが、この見解はあくまでも私たちの推測にすぎません。チャンネルは多数の動画をアップロードできるため、大規模なターゲット視聴者を獲得し、維持することができます。 YouTube で成功したい場合、私たちがあなたにできるアドバイスは、非常に垂直的な興味のタイプを目指し、10 分以上の動画を制作し続けることです。その動画は、選択した興味のタイプの動画でなければなりません。

これは非公開のブログですが、YouTube にはアルゴリズムに関する弾薬がたくさんあることをお知らせしておきます。YouTube がこの記事をアルゴリズムに関する否定的なニュースと捉えないことを願います。この研究を通じて、私は YouTube とそのアルゴリズム エンジニアがこれらのアルゴリズムを設計した先見の明に対して、さらに感謝の気持ちを抱きました。結局のところ、彼らは世界中の 10 億人のユーザーが毎月さまざまなビデオを視聴できるようにしようとしているのです。立ち止まって全体像を眺めてみると、YouTube アルゴリズムがいかに巧みに設計されているか、そしてビジネス目標の達成とプラットフォームの健全性の保護の両方においていかに優れたパフォーマンスを発揮しているかに驚かされるでしょう。 32 個のいいね!を付けてください。

著者について:

Matt Gielen 氏は Frederator Networks の元プログラミングおよび視聴者開発担当副社長です。マットは世界最大のアニメーション制作ネットワーク会社であるフレデレーターネットワークチャンネルを担当しています。

追記:

この記事を初めて見たのは、@fengyoung さんが Facebook でシェアしたときでした。タイトルが面白いと思ったので読んでみました。読んだ後、とても感動したので、もっと多くの人に見てもらえるように翻訳することにしました。

この記事は、3つの点で私にインスピレーションを与えました。

1. YouTube プラットフォームのアルゴリズム設計者の観点から見ると、多数の推奨アルゴリズムを設計する目的はチャンネルの視聴時間を増やすことであり、チャンネルの視聴時間を増やすことは、ユーザーが頻繁にプラットフォームにアクセスするように促すことです。これは双方にメリットのある考え方です。簡単に言えば、プラットフォームがユーザーを維持するのに貢献できる人には、プラットフォームから優先的にサポートが提供されます。

2. 記事では、縦型のコンテンツを作成することによってのみ YouTube で生き残ることができると結論付けています。プラットフォーム上のコンテンツが多様であればあるほど、そのプラットフォームは健全であることに疑いの余地はありません。私はこの結論には同意しますが、この記事の著者がどのようにしてこの結論に至ったのかはわかりません。これがYouTubeと国内動画プラットフォームの最大の違いです。国内動画プラットフォームは深刻な融合に向かっており、高額を投じて独占著作権を購入することが国内動画プラットフォームの唯一の逃げ道のようで、悪魔的な逃げ道でもあります。一方、YouTubeはアルゴリズムを使用して各チャンネルを特定の垂直コンテンツに特化させ、最も適切なユーザーとマッチングさせます。これはより壮大なコンテンツのチェスゲームです。

3. この記事の著者は、アルゴリズムがブラックボックスではなく、ハッキング可能であることを明らかにしています。これは氷山の一角にしかハッキングできませんが、それでも私たちの盲目的な操作よりはるかに明るいものです。著者の研究方法は、まずプラットフォームのアルゴリズムの目標が何であるかを明確にすることです。YouTube の場合、それは視聴時間です。次に、この目標がどの指標に関連しているかを観察し、さらに各指標をどのように改善できるかを確認します。

<<:  Pinyou Interactive の Han Jingbo: インターネット広告クラウド アルゴリズムのアーキテクチャとアプリケーション

>>:  Objective-C 実装と主要なソートアルゴリズムのグラフィカルなデモンストレーション比較

ブログ    

推薦する

ChatGPTのトラフィックは3か月連続で減少しており、大学生の活躍で回復に寄与している

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

顔認証の時代が本当に到来しました。あなたも参加してみませんか?

データによると、顔認識市場の規模は今後数年間、年間約20%の高い成長率を維持すると予想されています。...

再ハッシュ: ブルームフィルタアルゴリズムの実装原理を理解する

[[385658]]この記事では、広く使用されているアルゴリズムである「ブルーム フィルター アルゴ...

人工知能は人間の生活水準をどのように向上させることができるのでしょうか?

米国を例にとると、10年後には、成人一人当たり人工知能ビジネスから年間13,500ドルの利益を得るこ...

ロボットの時代、トラクターの背後にある1兆ドル市場

自動化農業の需要を満たすには、栽培者は栽培シーズンを通して作物の成長と健康に関する正確な情報を入手し...

...

米軍のAIブラックテクノロジー:暗闇でも正確に顔を認識できる。これに不安を感じる人はいるだろうか?

[[227002]]今日お話しするのは、「そんな手術があるの?」と第一印象でとても驚く内容ですが、...

...

生成型人工知能とは何かについて話しましょう

ジェネレーティブ AI は、これまでビジネス パーソンに依存していたモデルをアルゴリズム担当者が生成...

...

1 つの記事で TensorFlow ディープラーニングをマスターする

[[200803]] EnsorFlow ディープラーニングフレームワークGoogle はビッグデー...

ゼロから学ぶPythonによるディープラーニング!

人工知能は現在、飛躍的に成長しています。たとえば、自動運転車は時速数百万マイルで走行し、IBM Wa...

ネットワーク攻撃と防御における人工知能の応用と問題分析

サイバー攻撃と防御の対決は絶えず進化とアップグレードを続けています。人工知能は自己学習と適応能力を備...

スマート物流が一般的なトレンドであり、ロボット、ドローン、5Gの価値が強調されている

近年、電子商取引経済の急速な発展と人々の生活水準の継続的な向上により、物流の需要が急増していますが、...

7つの部門:AI、IoTなどの技術を活用し、廃家電リサイクル・処理のインテリジェント化を推進

近年、人工知能などの新世代情報技術や5Gなどの新世代通信技術の急速な発展に伴い、あらゆる分野で科学技...