fBox アルゴリズムを使用して、高度に隠蔽された詐欺ユーザーを検出する方法

[51CTO.com クイック翻訳] インターネットの活発な発展とインターネットユーザーの継続的な増加に伴い、さまざまなインターネット Web サイトがさまざまな技術的課題に直面しています。多くのユーザーは、さまざまな違法な動機により、金銭的利益を得るために詐欺行為に訴えることを選択します。一般的なインターネット詐欺行為には、短時間に多数のページをクリックすること (ロックステップ) が含まれます。

インターネット業界で横行する詐欺行為に対処するため、大手大学やインターネット企業は独自に設計したアルゴリズムを導入した。 Facebook は有名な CopyCatch および SynchroTrap アルゴリズムを導入しました。有名なカーネギーメロン大学も、詐欺防止アルゴリズムに関する一連の論文を発表しています。以下で紹介する論文はカーネギーメロン大学のもので、論文のタイトルは「fBox による疑わしいリンク動作の検出: 敵対的視点」です。

著者らはまず、不正防止スペクトル分析アルゴリズムの欠点を指摘した。スペクトル解析アルゴリズムでは通常、SVD アルゴリズムを使用してグラフの隣接行列を分解し、不正防止のためにより大きな固有値を持つベクトルに対応する特徴を選択します。スペクトル分析アルゴリズムは通常、より大規模で密度の高い不正グループを検出できますが、次の図のような、より小規模で隠れた不正グループに対しては通常無力です。

この図は、スペクトル分析アルゴリズムが Twitter ソーシャルネットワークデータセット上の多くの明らかな不正行為を検出できるものの、座標の原点にあるより隠れた不正行為に対しては無力であることを示しています。

著者らは、不正行為を検出するために敵対的アルゴリズムを採用し、まずどのような不正行為が一般的なスペクトル分析アルゴリズムを回避できるかを調査しました。スペクトル解析アルゴリズムは通常、グラフの隣接行列に対して SVD 分解を実行し、最初の K 個の最大固有値を使用してアルゴリズムを設計します。 K 番目に大きい固有値がであると仮定します。通常、固有値が k 未満の不正行為は、スペクトル解析アルゴリズムを回避できます。

具体的には、c 人のユーザーがいて、各ユーザーが f 個の不正アカウントを持つ不正ネットワークから s 件の不正アクションを購入したとします。攻撃者が制御できるアクションは、隣接行列の f * c 個のサブ行列です。このf * cのSVD分解によって得られる最大固有値が未満であれば、攻撃者はスペクトルアルゴリズムの検出を回避できることが証明できます。

攻撃者が使用できる主な攻撃方法は、ナイーブインジェクション、階段インジェクション、ランダムグラフインジェクションの 3 つです。

上の図には、一般的な 3 つの攻撃注入方法が示されています。 3つの攻撃注入方法の最大特性値は計算式で求めることができます。 3 つの攻撃注入方法のアルゴリズムの疑似コードを次の図に示します。

隠された攻撃は上位 K 個の固有ベクトルに反映されないため、著者らは隣接行列内のノードの出次数を使用して隣接行列を再構築します。隠れた攻撃は再構築されたノードのアウトディグリーにほとんど影響しないため、再構築値が小さい場合は通常、隠れた攻撃を意味します。この方法で不正ユーザーのセットを計算できます。同様に、隣接行列の入次数を再構築することで、秘密攻撃に使用されるアイテムのセットを検出できます。

fBox や SpokeEigen などのスペクトルアルゴリズムは補完的です。 fBox は通常、より微妙で小さな不正を検出できますが、SpokeEigen などのアルゴリズムは通常、より明白で直感的な不正を検出できます。不正検出の分野における SVD 分解の重要性は、fBox などのアルゴリズムからわかります。今日では、人工知能が急速に発展しており、線形代数などの基礎知識を習得することも非常に重要です。

原題: fBox による疑わしいリンク動作の検出: 敵対的視点、著者: Neil Shah、Alex Beutel、Brian Gallagher、Christos Faloutsos

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<: 人工知能に置き換えられる可能性が最も高い職業トップ10。今年の転職ではこの罠に陥らないように！

>>: AI時代に需要が高まる6つの仕事

ビデオメモリを節約する新しい方法: 2 ビット活性化圧縮を使用して PyTorch でニューラルネットワークをトレーニングする

fBox アルゴリズムを使用して、高度に隠蔽された詐欺ユーザーを検出する方法

ビデオメモリを節約する新しい方法: 2 ビット活性化圧縮を使用して PyTorch でニューラルネットワークをトレーニングする

ロボット犬をDIYするにはどれくらいの費用がかかりますか？価格は900ドルと安く、スタンフォード大学が開発し、コードはオープンソースです

天津市、スマートテクノロジー産業の発展促進に向け多方面から対策

AIビッグモデルの核となる概念を一挙に解説する人気科学記事

デジタル時代におけるデータ近代化の重要性

安全な生産を守り、ロボット、IoTなどの技術サポートを提供します。

ニューラルネットワークのトレーニングを4倍高速化！ Google Brainチームが「データエコー」アルゴリズムを提案

機械学習がインドのヘルスケア分野に変化をもたらす

推薦する

世界初の「サイボーグ」が死んだ！さようなら、ピーター 2.0

人工知能の台頭でIT業界やその他の分野は失業の波に直面するかもしれない

初めて精度が人間を超えました！アリババの機械読解力が世界記録を更新

2019年の人工知能予測

生成 AI は企業の知識管理をどのように改善できるのでしょうか?

快手テクノロジー副社長の王中元氏：ユーザーの90％はショートビデオに音楽を使用することを期待しています。快手は「AI+音楽」を使用してショートビデオの作成を支援します。

word2vecの作者はイリヤらとの10年間の恨みを明かした。seq2seqも私のアイデアだった

ハーバード大学とMITが協力し、新型コロナウイルスに遭遇すると自動的に光るスマートマスクを開発

人工知能はサイバー犯罪をより容易かつ頻繁にしている、と研究が指摘

2ポインタアルゴリズムを学んでLeetCodeをプレイする

脳に WiFi を入れると麻痺が治る？麻痺したサルが6日で普通に歩けるようになる