Zipf 行列分解: 推奨システムにおけるマシュー効果を解決する強力なツール

Zipf 行列分解: 推奨システムにおけるマシュー効果を解決する強力なツール

[[407036]]

[51CTO.com からのオリジナル記事]アルゴリズムの公平性は、近年、推奨システムにおける重要な研究方向となっています。多くの研究者や技術者がこの課題に対して多大な努力を払ってきました。推奨シナリオの入力データには通常、マシュー効果があるため、計算の中間プロセスと結果に影響を与えます。 2017年以降、マシュー効果を含む推奨システムの公平性の問題が大きな注目を集めています。 2020年、レコメンデーションシステムのサブフィールドにおける権威あるカンファレンスであるRecSysにおける関連論文の数は、かつてないレベルに達しました。 SIGIR や WWW などのトップカンファレンスでも、ランキング学習の公平性に関する論文が数多く発表されています。 Google などの関連企業も独自の推奨システム公平性フレームワークを持っています。

推奨システムにおけるマシュー効果を解決するためによく使用されるフレームワークは、損失関数にペナルティ項を追加することです。ペナルティ項の選択は研究論文によって異なりますが、相関関係などの多くのペナルティ項は、理論レベルではマシュー効果の範囲を正確に反映できません。 先日終了した2021年の国際学術会議ICAIBD 2021では、推薦システムにおけるマシュー効果に関する論文「Zipf Matrix Factorization: Matrix Factorization with Matthew Effect Reduction」が発表され、ペナルティ項の選択方法の問題を理論レベルで解決し、実験結果を通じて推薦システムが技術性能と公平性指標の両方を向上できることを実証しました。

Zipf 行列分解は、推奨システムの結果におけるアイテムのマシュー効果を測定するための統計指標を初めて明確に提案しました (以下に示すように)。

ここで、x は推奨システムの出力結果におけるアイテムの人気ランキングを表します。

ペナルティ項を追加した後の損失関数を下の図に示します。

損失関数を最適化するプロセスでは、ヒートランキング x の値はわからず、推定することしかできません。著者は、ペナルティなしの線形方程式と行列分解のシステムを使用して x 値を近似し、その後、確率的勾配降下法などの方法を使用して損失関数を解くことができます (以下に示すように)。

著者は次のように MovieLens データセットでアルゴリズム MAE をテストしました。

青い線で表される Zipf 行列分解 MAE 曲線の全体的なパフォーマンスは、ペナルティ項のない元の行列分解アルゴリズムよりも優れていることがわかります。次の図は、アルゴリズムのパフォーマンスが向上した一方で、Matthew 効果も向上したことを示しています。

Zipf 行列分解アルゴリズムは実装が簡単で、優れたパフォーマンスを発揮します。これは、推奨システムにおけるマシュー効果を解決するための強力なツールです。人工知能アルゴリズムの公平性の問題がますます注目されるようになると、人類は最終的にマトリックスの霧から抜け出し、人間と機械の平和的共存の夜明けを迎えることになるでしょう (マトリックス)。私たちは、私たちの周りで起こっている偉大な科学技術革命を目撃し、このような歴史的な瞬間にいることができて幸運です。

オリジナルリンク: https://arxiv.org/abs/2106.07347

著者について

テクニカル ディレクター兼建築家の Wang Hao 氏は、ユタ大学で学士号/修士号を取得し、国際ビジネス経済大学で MBA を取得しています。 Baidu、Sina、NetEase、Doubanなどの企業で長年にわたり研究開発と技術管理に携わっており、機械学習、ビッグデータ、推奨システム、ソーシャルネットワーク分析などの技術に長けています。彼はTVCGやASONAMなどの国際会議やジャーナルに11本の論文を発表している。国際学術会議IEEE SMI 2008およびICBDT 2020で最優秀論文賞を受賞。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  第4のパラダイム: AIによる意思決定が主要なビジネスシナリオを強化し、企業の質的変化の実現を支援

>>:  6月にはロボット産業が再び活況を呈し、数十億元の資金調達が相次いだ。

ブログ    
ブログ    
ブログ    

推薦する

WPS AI公式サイトがオンラインになりました: 経験者資格の申請、WindowsとAndroidのダウンロードをサポート

写真1 ▲WPS AI公式サイトのスクリーンショット7月6日、Kingsoft OfficeはWPS...

機械学習と従来のプログラミングの違いについて話す

[[264779]] AI と ML は誇張されすぎていて、if 文を書いたりプログラミングに関係す...

自動運転はAIの今後の発展の鍵となるのか?

現地時間10月12日、テスラのCEO、イーロン・マスク氏はツイッターで「約束通り、完全自動運転機能(...

OpenAI、ChatGPTのトレーニングで何百万ものユーザー情報を盗んだとして訴訟

有名モデルChatGPTの進路に、ちょっとした紆余曲折が訪れ始めた。カリフォルニアに拠点を置く法律事...

誰が私たちの個人情報をスパイしているのでしょうか?顔認識の悪用

「顔認証」や「顔スキャン決済」は顔認識技術の継続的な発展です。今では、小型カメラの助けを借りて、私た...

機械学習における欠損値に対処する9つの方法

データサイエンスはデータに関するものです。これは、あらゆるデータ サイエンスや機械学習プロジェクトの...

ビッグデータと人工知能の応用に関する7つのよくある誤解

大規模で高速かつ変化する情報資産を処理するためにビッグデータ テクノロジーを採用する組織が増えるにつ...

高度な分析とコンピューティング技術の出現が世界のインテリジェントアプリケーション市場を牽引

世界的なスマート アプリケーション市場の成長は、高度なコンピューティングおよび分析テクノロジによって...

...

...

...

職場におけるAIと自動化の重要性

AI は問題解決に新たな次元をもたらし、さまざまな業界の企業に利益をもたらします。 AI は、膨大な...

OpenAI の共同創設者 Karpathy が記事「自動運転による AGI の解釈」を公開しました。元の投稿は削除されました。保存済み

「汎用人工知能」に関しては、OpenAIの科学者カルパシー氏が説明を行った。数日前、Karpathy...

BAIRは、3種類のモデルフリー強化学習アルゴリズムを組み合わせたRLコードライブラリrlpytをオープンソース化しました。

最近、BAIR は強化学習研究コードライブラリ rlpyt をオープンソース化しました。このライブラ...

...