CTR は成功と失敗の鍵です。なぜクリックスルー率はアルゴリズム エンジニアにとって悪夢となっているのでしょうか?

CTR は成功と失敗の鍵です。なぜクリックスルー率はアルゴリズム エンジニアにとって悪夢となっているのでしょうか?

[[409064]]

みなさんこんにちは。私は梁唐です。

今日は、検索、広告、推奨アルゴリズムにおける非常に重要な指標である、有名なクリックスルー率についてお話ししたいと思います。

クリックスルー率という指標を聞いたことがある学生も多いと思います。意味はとても簡単です。名前の通り、クリックされる確率のことで、英語ではCTRといいます。これを数式で表すと、「クリック / インプレッション」となり、クリックは発生したクリックの総数、分母のインプレッションは露出回数となります。この 2 つの商がクリックスルー率です。これらは誰にとっても理解しやすいことですが、クリックスルー率がなぜそれほど重要なのかという疑問があります。この質問に答えられる人は多くありません。

クリックスルー率が重要な指標であるのはなぜですか?

検索、広告、推奨は、ほぼすべてのインターネット企業にとって最も重要な 3 つの事業であり、トラフィックの 3 つの主要なソースでもあります。

あなた自身のタオバオ利用体験を思い出してみてください。あなたが最もよく訪れるのは検索とホームページのおすすめではないでしょうか?厳密に言えば、広告はシーンではありません。検索とおすすめと深く融合しています。検索エリアとおすすめエリアの両方に広告があります。そして、今日のインターネット企業にとって、広告が主な収入源であることは疑いようがありません。

これらのシナリオでは、表示される結果の品質をどのように定量化するかという非常に深刻かつ重要な疑問が生じます。

ユーザーとしての私たちの体験は、もちろん非常に単純です。検索語を入力すると、返される結果は関連性がないため、当然悪い結果になります。しかし、問題は、それを反映するために厳密な数式をどのように使用するかということです。言い換えれば、返される効果をどのように定量化するのでしょうか。

たとえば、類似性に重点を置くため、検索シナリオの方が適している可能性があります。ただし、推奨シナリオには強力な情報を持つ検索用語がないため、類似性や非類似性といったものがないため、推奨や広告のシナリオにはあまり適していません。検索シナリオでも、類似性は品質を意味するわけではないので、あまり適していません。例えば、携帯電話を検索すると、結果はすべて模倣品の携帯電話か、聞いたことのない無名のブランドです。類似性だけで言えば、これらの結果は似ていますが、効果は明ら​​かに良くありません。

クリックスルー率をコア指標として使用することは、比較的適切でスマートなアプローチです。クリックスルー率が高いということは、ユーザーがクリックする意思があることを示しており、展示会の効果をある程度反映しています。

そのため、クリックスルー率はさまざまなシナリオで重要な指標となります。

クリック率と広告

それだけでなく、広告分野ではクリック率の予測が特に重要であり、広告システムの最も中核的な指標であることは間違いありません。

現在の電子商取引分野には、一般的に 3 つの広告モデルがあります。1 つは露出に基づくモデル、1 つはクリックに基づくモデル、そして最後の 1 つはトランザクションに基づくモデルです。これら 3 つのパターンは、人生でも非常に一般的です。いくつかの例を挙げて説明すれば、一目で理解できるでしょう。

1つ

たとえば、私たちが見るテレビコマーシャル、電柱に貼られた小さな広告、新聞広告などは、すべて第 1 のタイプに属します。テレビコマーシャルやテレビ番組のスポンサーシップなどの広告の効果を追跡する適切な方法がないためです。なぜなら、商品をクリックして詳細を表示できる電子商取引の広告とは異なり、一度読んだらそれで終わりだからです。

露出モデルは、Taobao のホームページ推奨や Double Eleven などのイベントの展示推奨など、電子商取引のシナリオにも存在します。販売者はイベントに参加するために一定の料金を支払いますが、これは一度限りの買い取りであり、プラットフォームは配送結果について一切責任を負いません。

このタイプの広告には、広告サービスプロバイダーが比較的強力であること、広告ブースが非常に優れていること、ゴールド含有量が非常に高いこと、競争が激しいことなど、いくつかの共通の特徴がよくあります。また、コカコーラやスナック菓子、車などの商品など、長期的な価値に焦点を当てた広告もあります。これらの製品は、広告によってすぐに効果が出ることはあまりありませんが、消費者に長期的な影響を与えることで商業的な利益を得ています。

2 番目のモデルはクリックベースの広告であり、これも最も一般的です。その特徴は、ユーザーにクリックを要求すること、つまりユーザーに広告を開く意図があることです。これは、現在のインターネット業界で最も主流の広告でもあります。たとえば、電子商取引プラットフォーム上の広告、ビデオメディア上の広告、検索エンジン上の広告のほとんどは、すべてこのタイプに属します。

このタイプの広告のサービス プロバイダーは、トラフィックを販売することで利益を上げるトラフィック ディーラーとして簡単に理解できます。獲得したトラフィックのメリットを最大限に引き出したいのであれば、当然、最も価値のある広告を表示する必要があります。広告の価値は 2 つの部分から成ります。1 つは広告主が提示する既知の希望価格です。もう 1 つは、クリックを生成するという期待値、つまりクリックスルー率です。したがって、広告の予想収益は、広告主の提示価格に広告のクリック率 (CTR) を掛けた値になります。

しかし、ここでちょっとした問題があります。広告のクリック率は事後的な値であり、広告を表示した後にしかクリック率を知ることができず、事前に取得することはできません。この問題を解決するために、クリックスルー率を予測するインテリジェントなアルゴリズムを使用する機械学習が導入されました。モデルによって予測されるクリックスルー率が pCTR であると仮定し、それに価格を掛けてこの広告の予想収益を算出します。

このように、広告の期待収益は特定の値になり、この値を使用して広告を表示するときに並べ替えることができ、期待収益が最も高い広告を前に、期待収益が最も低い広告を後ろに表示して、利益の最大化という目標を達成できます。

三つ

最後のタイプはトランザクションベースの広告で、一般的に規模が小さく、大手ショッピングガイドの Web サイトに似ています。 「What’s a Gift」や「What’s Worth Buying」などのウェブサイトのモデルは同じです。これらのウェブサイトは、トラフィックを販売者に誘導して取引をさせることで手数料を獲得しており、これは最も伝統的な広告モデルでもあります。

これら 3 つのモデルのうち、インターネット業界では 2 番目のモデルが最も広く使用されており、この広告メカニズムの中核はクリックスルー率の予測にあります。クリックスルー率の予測が正確であればあるほど、仕分け後の収益は高くなり、企業の収益性は向上します。収益性に関わることなので、それが重要な役割を果たすのは当然です。

クリックスルー率の問題点は何ですか?

ここまでお話ししてきましたが、クリックスルー率指標の有用性と重要性については、皆さんある程度ご理解いただけたのではないかと思います。しかし、世の中に完璧なものなど存在せず、アルゴリズムモデルの指標も同様です。クリックスルー率のみをモデルのトレーニング対象とすると、多くの問題が生じます。

以下にいくつか例を挙げます。

下品さとクリックベイト

一つは普通のタイトルと普通の写真、もう一つは衝撃的でスリリングな見出しと美女たちのセクシーな写真の組み合わせです。どちらがクリック率が高いかは、私が多くを言わなくても皆さんお分かりいただけると思います。

結局のところ、人間は視覚的な動物です。美しい女性の写真を見ると、クリックせずにはいられないストレート男性はほとんどいません。これが私たちの本能なのです。しかし、クリック率の高いコンテンツは必ずしも質が良いとは限らないという問題があります。それどころか、質が悪い場合も少なくありません。クリックベイトやカバー写真パーティーコンテンツが主要コンテンツプラットフォームで人気があるのはそのためです。この状態が続けば、ユーザーは美的疲労を感じ、プラットフォームへの信頼を失い、必然的にユーザー流出につながります。

これには典型的な例があります。Baidu と Sogou で「perspective」という単語を検索したところ、結果はまったく異なっていました。

これはBaiduからの結果です:

Sogou の結果は次のとおりです。

どのようなウェブサイトであっても、クリック率だけを追求していると、結局はクリックベイトや目を引くコンテンツなど、さまざまな悪いコンテンツでプラットフォームが埋め尽くされてしまうことがよくあります。本当に質の高いコアユーザーは既に完売していることが多いので、倒産もそう遠くない。

シーソー効果

2 つ目の問題はシーソー効果です。つまり、クリックスルー率が増加すると、他の指標が減少する可能性があります。

これは分かりやすいですね。例えば、ショッピングサイトで商品を検索したときに、美女が載った表紙ばかりが出てくると、注目されてクリック率が急上昇するかもしれません。しかし、検索結果が自分の希望通りでなければ、当然注文数や取引量が大幅に減少してしまいます。

クリックスルー率の高さと取引量の高さは、それ自体が 2 つの特性です。アルゴリズムはクリックスルー率の特性を強化しますが、必然的に他の特性が犠牲になります。これは、一部の動画サイトではより顕著に表れる可能性があります。たとえば、クリックスルー率は増加しているものの、視聴時間は減少し、ユーザーが毎日動画に費やす時間が減っている可能性があります。ユーザーがより多くの動画を閲覧するようになった一方で、忍耐力も低下し、これはプラットフォームの長期的な発展にとって明らかに有害です。

推奨シナリオでも同じことが言えます。ユーザーに推奨されたアイテムのクリック率が大幅に向上すれば、ユーザーは欲しいものをすぐに見つけて、ショッピングの目標を前もって達成できる可能性があります。すると、ユーザーが閲覧に費やす時間が短縮され、閲覧される商品の数も減り、自然に発生する取引の数も減少し、これもプラットフォームにとって不利になります。

どう対処するか

では、クリックスルー率に関するこれらの問題に対して、特に優れた解決策はあるのでしょうか?

残念ながら、いいえ。

クリックスルー率は非常に便利なので、使用しないことは不可能であり、アルゴリズムシステム全体が混乱してしまいます。そして、それは確かに問題を反映することができるので、間違いなく優れた中核指標です。

ただし、クリックスルー率に過度に依存すると、上記のような問題が実際に発生します。本当に頭の痛い問題ですが、業界には特に良い方法というものは存在しません。依然としてエンジニアが主体的に取り組み、人間の理解に基づいて調整を行うことに大きく依存しており、普遍的な戦略は存在しません。

現在主流のアプローチは、モデルが 1 つの目標に集中するのではなく、同時に複数の目標を学習し、クリックスルー率を向上させながら他の目標を最適化する方法を見つけることです。チームによっては、他の指標を無視して、まずクリックスルー率の最適化に重点を置きます。最適化が完了すると、他の指標も順番に最適化されます。

これらの方法は役に立たないとは言えませんが、根本的な原因ではなく症状を治療するだけで、病気を治すことはできないと言えます。実際、これは正常です。アルゴリズムのシナリオとアルゴリズムの最適化の目標は非常に複雑な問題です。単純な指標を使用して複雑なシナリオを定義してカバーすることは非現実的です。現在のモデルは単純な指標のみを認識して学習できます。複雑になると、範囲外になります。

そのため、現時点ではこの問題に対する根本的な解決策はなく、人力で解決するしかありません。これらの問題について考え、理解することは、モデルの原理やパラメータの調整方法よりもはるかに重要な、高レベルのアルゴリズムエンジニアにとって不可欠な知識でもあります。

さて、クリックスルー率についてお伝えしたいことは以上です。皆さんが楽しい週末を過ごせますように。

この記事はWeChatの公開アカウント「Coder Liang」から転載したもので、以下のQRコードからフォローできます。この記事を転載する場合は、Coder Liang の公式アカウントまでご連絡ください。

<<:  あなたのプライベートな写真が「合法的に」閲覧される可能性があります。顔認識を使用するときは必ず服を着用してください。

>>:  90年代以降の博士号取得者がアルゴリズムを使って生物の脳を置き換え、生きたマイクロロボットを作成し、サイエンス誌に発表した。

ブログ    
ブログ    

推薦する

PenFedは人工知能を活用して高度なパーソナライゼーションを実現

米国第2位の信用組合であるPenFedは、人工知能を活用して顧客とのやり取りの方法を変えようとしてい...

【専門家がここにいるエピソード3】大量ログ分析とインテリジェントな運用・保守

1. AIOpsとインテリジェントログセンター1.1 AIOps の 5 つのレベルインテリジェント...

オペレーティング システムのプロセス スケジューリング アルゴリズム (CPU 仮想化)

前回の記事では、オペレーティング システムが CPU を仮想化する方法についてすでに説明しました。今...

人工知能はますますあらゆる分野に浸透しつつある

近年、人工知能技術は急速に発展し、ますます多くの分野でその急速な発展の勢いと大きな可能性を発揮してい...

...

言葉はもっと欺瞞的だ! MITの最新研究:DeepFakeによる顔の加工はペンを使った編集ほど良くない

​DeepFake は発売以来、潜在的な「悪質な AI」としてリストアップされてきました。 有名な「...

最新のClaude2.1とLlama 2をご利用いただけます。アマゾンが生成型AI開発の参入障壁を下げる

良いニュースです。生成 AI アプリケーションの敷居が大幅に下がりました。先ほど、Amazon We...

ローカル AI: スマートフォン時代の低消費電力分析

人工知能にはボトルネック問題があります。これはディープ ニューラル ネットワークに基づいており、数億...

強化学習の博士号を取得して卒業することは人気がありますか? Redditユーザーがキャリアプランニングのアドバイスを求める

最近、修士号を取得して卒業しようとしているネットユーザーがネットユーザーに助けを求めました。「強化学...

最新のロボット学習システムが登場、たった1本の動画で仕事内容を学習可能

近い将来、人間はロボットにやり方を一度見せるだけで、タスクの実行方法を教えることができるようになるか...

2024 年のクラウド コンピューティング セキュリティの 5 つのトレンドと進歩

クラウドの世界を探ってみましょう。ただし、単なるクラウドではなく、未来のクラウドです。具体的には、2...

米国が中国へのAIソフトウェア輸出制限を発表、ドローンと自動運転が最初に影響を受ける

2020年が到来。テクノロジー規制は改善されたのでしょうか? [[311882]]空想を捨てなさい。...

ベセット氏との対話:自動運転車が人間の信頼を勝ち取るのはいつでしょうか?

[[257915]]編集者注:自動運転車が私たちの信頼を得られるのはいつでしょうか? 「十分に安全...