CLImF アルゴリズムを使用して推奨システムを設計する方法

CLImF アルゴリズムを使用して推奨システムを設計する方法

[51CTO.com からのオリジナル記事] 2010 年以降、レコメンデーション システムの分野ではさまざまなランキング学習手法が登場しました。いわゆるランキング学習とは、レコメンデーションシステムの機械学習アルゴリズムによって最適化される指標が、特定のスコアではなく、ユーザーに推奨されるアイテムのランキングであることを意味します。ランキング学習の問題を解決するアイデアは、一般的に、情報検索の分野で最適化が必要な指標を最初に提案し、次にそれを最適化するというものです。この指標は通常は滑らかではないため、最初に近似して滑らかな関数にする必要があります。情報検索指標が異なれば、生成されるアルゴリズムも異なります。この記事で紹介されているアルゴリズムは、Collaborative Less is More Filtering (CLimF) と呼ばれ、2013 年に人工知能に関する権威ある会議 IJCAI で発表されました。

CLimF によって最適化された情報検索メトリックは、逆数ランク (RR) と呼ばれ、ユーザーに推奨されるアイテムのリストで最初にクリックされたアイテムのランクの逆数を指します。たとえば、システムがユーザーに 10 本の映画を推奨し、ユーザーが最初にクリックした映画がシステム内で 2 番目にランク付けされた映画であるとします。RR を使用してシステムを測定する場合、スコアは 1/2 になります。ユーザーに推奨されるアイテムのリストは、推奨システムによって与えられたスコアに応じて高いものから低いものの順に並べられるため、アイテムのランキングが高いほど、推奨システムによって好まれることになります。そのため、ユーザーがクリックしたアイテムのランキングが高いほど、推奨効果は高くなります。これが RR インジケーターを設計した本来の目的です。

CLimF が試されるシナリオは、ユーザーに推奨されるアイテムは多くないが、比較的価値がある場合です。たとえば、ソーシャル ネットワーク上の友人からの推奨では、このシナリオでは、上位 3 つまたは上位 5 つの推奨の方が通常はより価値があります。

RR の正式な定義は次のとおりです。

得られた式は滑らかな関数ですが、その複雑さは非常に高いため、実際のアプリケーションでは代替式を見つける必要があります。

***我々は確率的勾配降下法によって***化関数を解きます。

CLiMF 関数を他のアルゴリズムと比較した評価結果は次のとおりです。

CLiMF と他のアルゴリズムの比較:

  • CofiRank: CofiRank は、ランキング学習を推奨システムに適用した最初のアルゴリズムです。NDCG を最適化しますが、バイナリ分類問題には適していません。
  • ベイジアンパーソナライズランキング: ネガティブサンプルが必要ですが、CLiMF ではポジティブなサンプルのみが必要です

著者について:

[[263239]]

ブロックチェーン企業の科学者であり、恒昌利通のビッグデータ部門の元責任者である王昊氏は、ユタ大学で学士号/修士号を取得しています。百度、新浪、網易、豆瓣などの企業で長年の研究開発と技術管理の経験があります。機械学習、ビッグデータ、推奨システム、ソーシャルネットワーク分析などの技術に長けています。 TVCGやASONAMなどの国際会議やジャーナルに10本の論文を発表している。私の学部論文は 2008 IEEE SMI *** 論文賞を受賞しました。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  マスク氏:ヒューマン・マシン・インターフェース技術は「間もなく利用可能になる」、人間のIQはAIに匹敵する

>>:  統計と機械学習の違いは何ですか?

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

超強力なTP-Link!北京大学と清華大学が共同で一般AI実験クラスを設立、朱松春氏が指導

史上最強の集団が力を合わせてAI開発に挑む?最近、北京大学の公式Weiboアカウントは、北京大学と清...

機械学習から最も恩恵を受ける4つの業界

機械学習は、将来性が最も高く、業界に最大のメリットをもたらす AI の分野です。関連レポートによると...

機械学習アルゴリズムの長所と短所の比較と選択(要約)

この記事の目的は、現在の機械学習アルゴリズムの実用的かつ簡潔な一覧を提供することです。この記事の内容...

...

人工知能はあらゆる産業に革命を起こすだろう

今日のさまざまな業界における人工知能の影響を見てみましょう。 [[421328]] 1. 自動車産業...

Playgroundで数値アルゴリズムを学ぶ

中学校では、数学の描画ほど恐ろしいものはありませんでした。多くの問題にはすぐに利用できる解析的解法が...

面接の質問に必ず読むべき一冊! Python のトップ 5 ソート アルゴリズムとその実装コード

ソートは、すべての IT エンジニアと開発者にとって不可欠な知識スキルです。コーディング面接に合格す...

ChatGPTはAmazonに「オンラインストアを開設」し、一夜にしてインターネットの有名人になった

「当社の [製品] は、[タスク 1]、[タスク 2]、[タスク 3] など複数のタスクに使用できる...

1 つの記事で 10 個のアルゴリズムをカバーします。基本的なグラフアルゴリズムの視覚的な説明

[[343053]]グラフは、ソーシャル メディア ネットワーク、Web ページやリンク、GPS の...

2018年、中国とアメリカのインターネット大手によるAIチップ戦争で、BATはFANGに挑戦できるのか?

AI時代に注目すべき新たな変化は、テクノロジー大手がAIチップを独自に開発し始めたことだ。これは一...

「あなたは私の中にいて、私はあなたの中にいる」人工知能はビッグデータと恋愛関係になりたい!

最近では、「ビッグデータ」や「人工知能」ほどよく使われる流行語はほとんどありません。多くのデータ分析...

サービスロボットは驚異的なユニコーンを生み出すことができるか?

サービスロボットはニッチな領域を超えつつあるようだ。まず、2018年の世界ロボット産業の市場規模は2...

...

...