fBox アルゴリズムを使用して、高度に隠蔽された詐欺ユーザーを検出する方法

fBox アルゴリズムを使用して、高度に隠蔽された詐欺ユーザーを検出する方法

[51CTO.com クイック翻訳] インターネットの活発な発展とインターネットユーザーの継続的な増加に伴い、さまざまなインターネット Web サイトがさまざまな技術的課題に直面しています。多くのユーザーは、さまざまな違法な動機により、金銭的利益を得るために詐欺行為に訴えることを選択します。一般的なインターネット詐欺行為には、短時間に多数のページをクリックすること (ロックステップ) が含まれます。

インターネット業界で横行する詐欺行為に対処するため、大手大学やインターネット企業は独自に設計したアルゴリズムを導入した。 Facebook は有名な CopyCatch および SynchroTrap アルゴリズムを導入しました。有名なカーネギーメロン大学も、詐欺防止アルゴリズムに関する一連の論文を発表しています。以下で紹介する論文はカーネギーメロン大学のもので、論文のタイトルは「fBox による疑わしいリンク動作の検出: 敵対的視点」です。

著者らはまず、不正防止スペクトル分析アルゴリズムの欠点を指摘した。スペクトル解析アルゴリズムでは通常、SVD アルゴリズムを使用してグラフの隣接行列を分解し、不正防止のためにより大きな固有値を持つベクトルに対応する特徴を選択します。スペクトル分析アルゴリズムは通常、より大規模で密度の高い不正グループを検出できますが、次の図のような、より小規模で隠れた不正グループに対しては通常無力です。

この図は、スペクトル分析アルゴリズムが Twitter ソーシャル ネットワーク データ セット上の多くの明らかな不正行為を検出できるものの、座標の原点にあるより隠れた不正行為に対しては無力であることを示しています。

著者らは、不正行為を検出するために敵対的アルゴリズムを採用し、まずどのような不正行為が一般的なスペクトル分析アルゴリズムを回避できるかを調査しました。スペクトル解析アルゴリズムは通常、グラフの隣接行列に対して SVD 分解を実行し、最初の K 個の最大固有値を使用してアルゴリズムを設計します。 K 番目に大きい固有値が であると仮定します。通常、固有値が k 未満の不正行為は、スペクトル解析アルゴリズムを回避できます。

具体的には、c 人のユーザーがいて、各ユーザーが f 個の不正アカウントを持つ不正ネットワークから s 件の不正アクションを購入したとします。攻撃者が制御できるアクションは、隣接行列の f * c 個のサブ行列です。このf * cのSVD分解によって得られる最大固有値が 未満であれば、攻撃者はスペクトルアルゴリズムの検出を回避できることが証明できます。

攻撃者が使用できる主な攻撃方法は、ナイーブ インジェクション、階段インジェクション、ランダム グラフ インジェクションの 3 つです。

上の図には、一般的な 3 つの攻撃注入方法が示されています。 3つの攻撃注入方法の最大特性値は計算式で求めることができます。 3 つの攻撃注入方法のアルゴリズムの疑似コードを次の図に示します。

隠された攻撃は上位 K 個の固有ベクトルに反映されないため、著者らは隣接行列内のノードの出次数を使用して隣接行列を再構築します。隠れた攻撃は再構築されたノードのアウトディグリーにほとんど影響しないため、再構築値が小さい場合は通常、隠れた攻撃を意味します。この方法で不正ユーザーのセットを計算できます。同様に、隣接行列の入次数を再構築することで、秘密攻撃に使用されるアイテムのセットを検出できます。

fBox や SpokeEigen などのスペクトル アルゴリズムは補完的です。 fBox は通常、より微妙で小さな不正を検出できますが、SpokeEigen などのアルゴリズムは通常、より明白で直感的な不正を検出できます。不正検出の分野における SVD 分解の重要性は、fBox などのアルゴリズムからわかります。今日では、人工知能が急速に発展しており、線形代数などの基礎知識を習得することも非常に重要です。

原題: fBox による疑わしいリンク動作の検出: 敵対的視点、著者: Neil Shah、Alex Beutel、Brian Gallagher、Christos Faloutsos

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  人工知能に置き換えられる可能性が最も高い職業トップ10。今年の転職ではこの罠に陥らないように!

>>:  AI時代に需要が高まる6つの仕事

ブログ    

推薦する

新しい研究では、AIを使用してトラウマ性解離を引き起こす脳領域を探索する

[[344125]]解離や解離性障害は、特に幼少期に極度のトラウマや慢性的な虐待を経験した人々によっ...

...

人工知能は2018年にこれら5つの業界に革命を起こすだろう

科学技術分野における人工知能技術に関する議論は最高潮に達したようだ。昨年半ば、国務院は「新世代人工知...

ChatGPT の実際のパラメータはわずか 200 億であり、これは Microsoft によって初めて公開されました。ネットユーザー:OpenAIがオープンソースに不安を感じるのも無理はない

突然、大規模なモデリングコミュニティ全体が同じことについて話すようになりました。マイクロソフトの論文...

Llama 2 第 2 波のハイライト: 慎重すぎるため、コード生成には改善の余地が大いにある

有用か無害かLlama-2-chat は、セキュリティ フィルターに関して過度に敏感な動作を示すこと...

大規模マルチビューガウスモデル(LGM):5秒で高品質の3Dオブジェクトを生成、試用可能

メタバースにおける 3D クリエイティブ ツールの需要の高まりに対応するため、3 次元コンテンツ生成...

将来は知能ロボットが農業を担う

果物の収穫から雑草の除去まで、ロボットは精密農業で大きな成果を上げています。農家は常に熱心なデータ収...

深度はディープニューラルネットワークに具体的に何をもたらすのでしょうか?

[[186161]]起源近年、人工知能は爆発的な成長を遂げており、ディープラーニングはその主な原動...

...

GoogleのAIオープンソース成果物は3年前に誕生し、想像もつかないような多くの場所で使用されている。

2016年3月、人間と機械の戦い「イ・セドル対AlphaGo」は、人工知能の力を世界に知らしめた。...

「アンティーク」GPUでもDeepSeekと同じGRPOを実行できます。ビデオメモリは1/10しか必要とせず、コンテキストは10倍に増加します

オープンソースの微調整ツール Unsloth が新しいテクノロジーを携えて戻ってきました。前回のアッ...

安全で制御可能、かつ法的に準拠した人工知能は金融分野で「原則化」されている

現在、国内の新興デジタルインフラの進歩と、5G、クラウドコンピューティング、ビッグデータなどのモジュ...

...

今後10年間で人工知能はどのように発展するでしょうか?

人工知能が台頭していることに疑いの余地はない。しかし、SF映画『バック・トゥ・ザ・フューチャー』が示...