[51CTO.com からのオリジナル記事] 哲学にさまざまな流派があるように、推奨システムのアルゴリズム設計の考え方もさまざまな流派に分けられます。ランキング学習は、こうした考え方の 1 つにすぎません。 RecSys などの国際的な推奨システム会議に精通している実務家は、2010 年以降、ランキング学習に基づく推奨システム アルゴリズムが多数登場していることに気付くかもしれません。ベイジアン・パーソナライズド・ランキング (BPR) からそれに続く Collaborative Less is More Filtering (CLiMF)、そして GapFM や XCLiMF などの他のアルゴリズムに至るまで、推奨システムの分野では百花繚乱の状況が続いています。 ランキング学習と協調フィルタリング、行列分解とそれに続くディープラーニングの設計思想の主な違いは、ランキング学習では推奨システムをランキングの問題として捉えている点です。つまり、ユーザーに商品をどのように推奨するかという問題は、ユーザーが好む可能性のある商品セット内で商品をどのように並べ替えるかという問題になります。このプロセスでは、アルゴリズムはユーザーが好むアイテムの評価を正確に予測することに重点を置くのではなく、アイテム間の連続的な関係を最適化の目標とします。 ランキング学習の英語名は Learning to Rank です。最適化の目的の違いにより、ポイントワイズランキング学習、ペアワイズランキング学習、リストワイズランキング学習の 3 つのカテゴリに分類されます。ポイントベースのランキング学習は、本質的には従来の分類アルゴリズムです。たとえば、SVM とロジスティック回帰はすべてポイントベースのランキング学習です。このタイプのランキング学習は、通常、ランキング学習の退化した形式であると考えられています。関係ペアベースのランキング学習は、アイテム セット内のアイテム間の関係を重視します。この章で説明するベイジアン パーソナライズ ランキング アルゴリズムは、このタイプのアルゴリズムに属します。リストベースのランキング学習は、アイテム セット内のアイテム リストの全体的なランキング関係を重視します。以降の章で説明するコラボレーティブ Less is More フィルタリング アルゴリズムは、このカテゴリに属します。このタイプのアルゴリズムは、アイテム セット内のアイテム スコアの全体的なランキング関係を最終的な最適化目標とします。 ベイジアン パーソナライズ ランキングの全体的な考え方は次のとおりです。現在、N 本のビデオがあり、それぞれのビデオには、ユーザーがクリックする、ユーザーがクリックしないという 2 つのユーザー ビヘイビアがあるとします。ここで、アイテムに対するユーザーによる評価を次のように設定します。ユーザーがクリックした動画のスコアは +1 となり、一部の動画はユーザーがクリックしていない動画からサンプリングされます。これらの動画はユーザーが好まない動画とみなされ、スコアは -1 となります。 ベイジアン パーソナライズ ランキングでは、まず、ユーザーによるアイテムの評価の背後にあるモデルが、行列分解モデルなどの一般的なモデルであると想定します。つまり、ユーザーによるアイテムの評価は R = U' * V となり、U はユーザー ベクトル、V はアイテム ベクトルとなります。アルゴリズムでは、スコアが +1 のすべての項目とスコアが -1 のすべての項目について、スコア マトリックス R を使用して項目を再スコアリングすると、元々スコアが +1 だった項目の新しいスコアは、元々スコアが -1 だった項目の新しいスコアよりも高くなると想定しています。 アルゴリズムの本質は、元の +1 項目スコアが -1 項目スコアよりも可能な限り高くなるという条件下で、R スコア分解後に U ベクトルと V ベクトルを推測することです。 ***U と V の積を計算することで、アイテムに対するユーザーの完全な評価マトリックスを取得し、アルゴリズムのプロセス全体を完了します。アルゴリズムについて詳しく説明しましょう。 まず、順序関係を定義します。ユーザーがアイテム I1 を気に入っているが、アイテム I2 を気に入っていない場合、順序関係 I1 >u I2 が存在します。評価マトリックスをパラメーター theta として定義し、最適化する必要があるベイズ モデルを構築します。 u が順序付きペア (I1、I2) を表し、尤度関数を解く式を次のように確立します。ここで、はシグモイド関数です。ここで定義されるベイズモデルは一般的なフレームワークであり、具体的なアルゴリズムモデルの実装は計算方法に依存します。 ベイジアン パーソナライズ ランキングによって最適化されるメトリックは AUC 関数です。ベイジアンパーソナライズドランキング問題では、AUC 関数は次の形式に簡略化されます。 で 確率的勾配降下法を使用してパラメータを解くと、次のようになります。 、 これは、アイテム i とアイテム j に対するユーザー u のスコアの差であることがわかります。確率的勾配降下法のプロセスにおけるパラメータ計算方法を取得しました。実際のアプリケーションでは、協調フィルタリングや行列分解などの特定のモデルに置き換えるだけで済みます。これらをそれぞれBPR-CF、BPR-MFなどのコード名で表します。 ここで、行列分解モデルによって計算されると仮定します。つまり = U'V = であり、確率的勾配降下法の式は次のようになります。 同様に、協調フィルタリングに基づく BPR の勾配降下法の式を取得できます。 BPR は 2 つの順序付きペアの関係を計算するため、実際の計算プロセスに含まれるデータの量は非常に大きくなる可能性があります。さらに、評価予測を行う際には膨大な行列演算が必要になります。通常、実際の計算プロセスでは、すべてのデータを使用して計算するのではなく、サンプリングなどの方法を採用して計算量を削減します。 BPR は、推奨システムにおけるペアベースのランキング学習において比較的重要な方法であり、推奨システムのさまざまな実践で広く使用されています。
ブロックチェーン企業の科学者である王昊氏は、ユタ大学で学士号/修士号を取得し、国際経済貿易大学で実務MBAを取得しています。百度、新浪、網易、豆板などの企業で8年以上の技術研究開発の経験があり、恒昌立通のビッグデータ部門のディレクターを務めてきました。機械学習、データマイニング、コンピューターグラフィックス、科学的視覚化の専門家。 TVCGやASONAMなどの国際会議やジャーナルに10本の論文を発表している。私の学部論文は 2008 IEEE SMI *** 論文賞を受賞しました。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
<<: 負けても落ち込まないで! Google、ロボット工学プロジェクトを再開
>>: 機械学習における不均衡なクラスに対処するための 5 つの戦略
[[378336]]死者を生き返らせるというのは非常に神秘的に聞こえますが、技術の進歩により、科学者...
[[258183]]この記事はWeChatの公開アカウント「AI Front」(ID: ai-fr...
AI 技術の継続的な革新と発展により、人工知能 (AI) は多くの分野で大きな進歩を遂げており、その...
[[329919]]近年、人工知能は急速に発展しており、コンピュータービジョンや自然言語処理の分野で...
調査会社ガートナーは、データ サイエンスおよび機械学習プラットフォームを「さまざまなデータ サイエン...
[[441688]]モデルのパラメータサイズはそれほど大きくする必要はありません。今年初めにOpe...
ChatGPT は 11 月下旬のリリース以来、ビジネス、法律、医学部の大学院レベルの試験に合格する...
ソフトウェア開発者向けのローコード機能それでは、ソフトウェア開発者に機械学習機能を提供するローコード...
海外メディアCNETによると、ボストン・ダイナミクスのロボット犬「スポット」はすでにダンス、鉱山探索...
リアルタイムサービスの波が徐々に私たちの日常生活に浸透するにつれ、コンピューティングインフラストラク...
——原題:2021年中国人工知能産業の市場現状と有利な軌道の分析。コンピュータビジョンは1000億...
今年に入ってからは、ChatGPTやGPT-4などの技術の応用により、深層合成製品やサービスが増加し...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
11月8日、Googleの研究者3人がプレプリントライブラリ(ArXiv)に最近提出した論文の中で、...