Zipf 行列分解: 推奨システムにおけるマシュー効果を解決する強力なツール

Zipf 行列分解: 推奨システムにおけるマシュー効果を解決する強力なツール

[[407036]]

[51CTO.com からのオリジナル記事]アルゴリズムの公平性は、近年、推奨システムにおける重要な研究方向となっています。多くの研究者や技術者がこの課題に対して多大な努力を払ってきました。推奨シナリオの入力データには通常、マシュー効果があるため、計算の中間プロセスと結果に影響を与えます。 2017年以降、マシュー効果を含む推奨システムの公平性の問題が大きな注目を集めています。 2020年、レコメンデーションシステムのサブフィールドにおける権威あるカンファレンスであるRecSysにおける関連論文の数は、かつてないレベルに達しました。 SIGIR や WWW などのトップカンファレンスでも、ランキング学習の公平性に関する論文が数多く発表されています。 Google などの関連企業も独自の推奨システム公平性フレームワークを持っています。

推奨システムにおけるマシュー効果を解決するためによく使用されるフレームワークは、損失関数にペナルティ項を追加することです。ペナルティ項の選択は研究論文によって異なりますが、相関関係などの多くのペナルティ項は、理論レベルではマシュー効果の範囲を正確に反映できません。 先日終了した2021年の国際学術会議ICAIBD 2021では、推薦システムにおけるマシュー効果に関する論文「Zipf Matrix Factorization: Matrix Factorization with Matthew Effect Reduction」が発表され、ペナルティ項の選択方法の問題を理論レベルで解決し、実験結果を通じて推薦システムが技術性能と公平性指標の両方を向上できることを実証しました。

Zipf 行列分解は、推奨システムの結果におけるアイテムのマシュー効果を測定するための統計指標を初めて明確に提案しました (以下に示すように)。

ここで、x は推奨システムの出力結果におけるアイテムの人気ランキングを表します。

ペナルティ項を追加した後の損失関数を下の図に示します。

損失関数を最適化するプロセスでは、ヒートランキング x の値はわからず、推定することしかできません。著者は、ペナルティなしの線形方程式と行列分解のシステムを使用して x 値を近似し、その後、確率的勾配降下法などの方法を使用して損失関数を解くことができます (以下に示すように)。

著者は次のように MovieLens データセットでアルゴリズム MAE をテストしました。

青い線で表される Zipf 行列分解 MAE 曲線の全体的なパフォーマンスは、ペナルティ項のない元の行列分解アルゴリズムよりも優れていることがわかります。次の図は、アルゴリズムのパフォーマンスが向上した一方で、Matthew 効果も向上したことを示しています。

Zipf 行列分解アルゴリズムは実装が簡単で、優れたパフォーマンスを発揮します。これは、推奨システムにおけるマシュー効果を解決するための強力なツールです。人工知能アルゴリズムの公平性の問題がますます注目されるようになると、人類は最終的にマトリックスの霧から抜け出し、人間と機械の平和的共存の夜明けを迎えることになるでしょう (マトリックス)。私たちは、私たちの周りで起こっている偉大な科学技術革命を目撃し、このような歴史的な瞬間にいることができて幸運です。

オリジナルリンク: https://arxiv.org/abs/2106.07347

著者について

テクニカル ディレクター兼建築家の Wang Hao 氏は、ユタ大学で学士号/修士号を取得し、国際ビジネス経済大学で MBA を取得しています。 Baidu、Sina、NetEase、Doubanなどの企業で長年にわたり研究開発と技術管理に携わっており、機械学習、ビッグデータ、推奨システム、ソーシャルネットワーク分析などの技術に長けています。彼はTVCGやASONAMなどの国際会議やジャーナルに11本の論文を発表している。国際学術会議IEEE SMI 2008およびICBDT 2020で最優秀論文賞を受賞。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  第4のパラダイム: AIによる意思決定が主要なビジネスシナリオを強化し、企業の質的変化の実現を支援

>>:  6月にはロボット産業が再び活況を呈し、数十億元の資金調達が相次いだ。

ブログ    
ブログ    

推薦する

...

Nvidiaは写真編集ソフトウェアGANを

[[438694]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

ファーウェイクラウドは、2021年世界インターネット会議で人工知能イノベーションの3つの要素を提案し、新たな産業エコシステムを構築

本日、2021年世界インターネット大会烏鎮サミットにおいて、ファーウェイ上級副社長、ファーウェイクラ...

5G時代の人工知能のホットスポットとなる業界はどこでしょうか?

このプロセスでは、多くのアプリケーションが継続的に追加されています。たとえば、コンピュータと通信の統...

AlphaFold2 の原理: 注意メカニズムが畳み込みネットワークに取って代わり、予測精度が 30% 以上向上

[[412540]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

シュナイダーエレクトリックの革新力は、デジタル化と低炭素化の二重の変革を加速させる上でどのような役割を果たすのでしょうか。

デジタル変革の後半期に入る中、デジタルとリアルの融合をいかに加速し、グリーン・低炭素の発展へと向かう...

...

機械学習が量子加速を実現、AI研究のパラダイムが完全に変わる可能性

最近、 Quanta Magazineに掲載された記事では、機械学習が量子加速を実現したと指摘されま...

中科世宇の王金橋氏:5Gは新しい警察アプリケーションを強化し、交通管理の「細かく科学的な」管理を改善します

最近、「つながりとインテリジェンス、より安全な世界の構築」をテーマにした2021年世界セキュリティ博...

人工知能技術が伝染病の予防と制御に役立つ

[[318426]]現在、人工知能技術は急速に発展しており、特に医療保健の分野では、生活の各分野で広...

新しい調査によると、アメリカ人の48%は自動運転車に乗りたくないと考えている。

自動運転の開発は本当に難しいです。この困難は技術的な難しさだけでなく、人々の直感的な不信感によっても...

機械学習の基礎チャート: 概念、原則、歴史、トレンド、アルゴリズム

1. 機械学習の概要1. 機械学習とは何ですか?機械は大量のデータを分析して学習します。たとえば、猫...

2027年までに、世界のAI医療画像ソリューション市場は47億2,060万米ドルに達すると予測されています。

3月26日、エマージング・リサーチが発表した最新レポートによると、世界の人工知能医療画像ソリューシ...

負荷分散アルゴリズムの完全なリスト

負荷分散の開発基盤は負荷分散アルゴリズムです。次に、サーバーごとに持つ機能や必要な機能が異なるため、...