ZeroMat: データを一切使用せずにレコメンデーションシステムのコールドスタート問題を解決する

ZeroMat: データを一切使用せずにレコメンデーションシステムのコールドスタート問題を解決する

[[428372]]

[51CTO.com からのオリジナル記事]推奨システムは、登場以来、学界や産業界で広く使用されてきました。 Amazon、Toutiao、Douyin などの多くの重要な Web サイトは、大量のクリック数と莫大な企業利益を得るために推奨システムに依存しています。推奨システムのクリックスルー率を向上させる方法は、依然として業界の主要な研究方向の 1 つです。

推奨システムは多くの注目を集めていますが、推奨システムの実践者を常に悩ませてきた固有の問題がいくつかあります。コールド スタート問題は、レコメンデーション システムにおける重要な研究テーマです。この問題は広く注目されているものの、効果的な解決策が常に不足しています。

推奨システムのコールドスタート問題とは、新しいユーザーや新しいアイテムに遭遇したときに、履歴データが不足しているためにユーザーに推奨できないという問題を指します。現在、人気のあるソリューションには、メタ学習などの技術的な方法が含まれます。

ICISCAE 2021で、研究者らは、入力データを一切使用せず、評価データの最大値のみを知ることで、推奨システムのコールドスタート問題を解決するZeroMatと呼ばれるアルゴリズムを提案しました。

まず、著者は確率的行列分解のフレームワークを借用して行列分解の問題を定義します。つまり、次の確率の最大値を計算します。

Zipf の法則に従って、ユーザー評価の確率分布を次のようにモデル化します。

さらに、次のように正規分布をモデリングに使用します。

式を展開すると、次の式が得られます。

確率的勾配降下法を使用すると、次のようになります。

ソート後、ユーザー評価値を復元します。

計算プロセス全体で外部入力データが使用されていないことに気付きました。U と V はパラメーターであり、知っておく必要があるのはスコアの最大値だけです。たとえば、映画の評価の最大値が 1 か 5 かは、通常、製品設計上の問題であり、事前にわかっています。

実験では、ZeroMat、ランダム値、従来の行列分解アルゴリズムの 3 つのアルゴリズムの効果を比較しました。ZeroMat の効果を検証するために、MAE と Matthew 効果の度合いという 2 つの指標を使用しました。驚くべきことに、ZeroMat は、完全な入力データを使用した従来の行列分解アルゴリズムよりも優れたパフォーマンスを発揮することがあります。

MAE における 3 つの異なるアルゴリズムのテスト結果

マシュー効果の度合いに関する3つの異なるアルゴリズムのテスト結果

推奨システムにおけるマシュー効果は、長い間、研究者や業界の専門家を悩ませてきました。ZeroMat は、データを一切使用せずにコールド スタート問題を解決する最初のアルゴリズム フレームワークです。このアルゴリズムは理解しやすく、実行速度も速く、非常に優れた結果が得られるため、推奨システムのコールド スタート問題を完全に解決するための新たな扉を開きます。

論文アドレス: https://www.researchgate.net/publication/354996721_ZeroMat_Solving_Cold-start_Problem_of_Recommender_System_with_No_Input_Data

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  カリフォルニア工科大学、プロペラアームを使って滑空する二足歩行ロボットを開発

>>:  人工知能の時代:知識を活用して人間関係を変える

ブログ    

推薦する

...

ソフトマックスを放棄した初の大規模線形アテンショントランスフォーマーモデル: 1750億のパラメータ、より優れた速度と精度

最近、上海人工知能研究所とOpenNLPLabの研究チームが、ソフトマックスベースの注意メカニズムを...

待望のAIは人工知能か、それとも人工的な愚かさか?

[[399557]]人工知能という言葉が初めて世間の注目を集めたのは、1956 年にダートマス大学...

旅行業界における機械学習と AI: 5 つの重要な業界ユースケース

旅行を計画していると想像してください。 数十年前であれば、旅行先や宿泊施設の選択肢を調べたり、航空券...

自動運転の知識 ポピュラーサイエンス 自動運転車の7つのコア技術

自動運転技術の本質は、機械の観点から人間のドライバーの行動をシミュレートすることです。その技術的フレ...

...

...

人工知能の応用分野と必要な専門知識

1. 人工知能の応用分野1. コンピュータービジョン生体認証: 顔認識、歩行認識、歩行者 ReID、...

AIチップ業界は発展の初期段階にあり、将来的には大きな市場の可能性を秘めている

世界のPC業界が年々衰退し、スマートフォン市場が飽和状態に陥る中、ビッグデータ、クラウドコンピューテ...

「バンカーズアルゴリズム」の秘密が明らかに!フロントエンド テーブルでカスタム数式を使用して「偶数に丸める」

銀行の収益モデルとは何でしょうか? 3 つの言葉: 情報の非対称性です。銀行は預金者から資金を集めて...

...

倪光南学士がRAG技術、AIエージェント、AI倫理的課題について語る

中国工程院の院士である倪光南氏は、第2回北京人工知能産業革新発展会議で人工知能の発展に関する見解と経...

GitHub トップ プロジェクト: 30 万語の図解アルゴリズム問題辞書、超実用的なリソース、6,000 個のスター

[[336071]]貴重なリソースをまとめましたので、ぜひご覧ください。アルゴリズムはコンピュータサ...

[強く推奨] 史上最も包括的な IT アーキテクト技術知識マップ 34 選

この記事は、著者が長年にわたり蓄積し収集してきた知識とスキルのマップです。編集者は、これを周囲の技術...