ベイジアンパーソナライズランキングアルゴリズムを1つの記事で理解する

ベイジアンパーソナライズランキングアルゴリズムを1つの記事で理解する

[[260485]]

[51CTO.com からのオリジナル記事] 哲学にさまざまな流派があるように、推奨システムのアルゴリズム設計の考え方もさまざまな流派に分けられます。ランキング学習は、こうした考え方の 1 つにすぎません。 RecSys などの国際的な推奨システム会議に精通している実務家は、2010 年以降、ランキング学習に基づく推奨システム アルゴリズムが多数登場していることに気付くかもしれません。ベイジアン・パーソナライズド・ランキング (BPR) からそれに続く Collaborative Less is More Filtering (CLiMF)、そして GapFM や XCLiMF などの他のアルゴリズムに至るまで、推奨システムの分野では百花繚乱の状況が続いています。

ランキング学習と協調フィルタリング、行列分解とそれに続くディープラーニングの設計思想の主な違いは、ランキング学習では推奨システムをランキングの問題として捉えている点です。つまり、ユーザーに商品をどのように推奨するかという問題は、ユーザーが好む可能性のある商品セット内で商品をどのように並べ替えるかという問題になります。このプロセスでは、アルゴリズムはユーザーが好むアイテムの評価を正確に予測することに重点を置くのではなく、アイテム間の連続的な関係を最適化の目標とします。

ランキング学習の英語名は Learning to Rank です。最適化の目的の違いにより、ポイントワイズランキング学習、ペアワイズランキング学習、リストワイズランキング学習の 3 つのカテゴリに分類されます。ポイントベースのランキング学習は、本質的には従来の分類アルゴリズムです。たとえば、SVM とロジスティック回帰はすべてポイントベースのランキング学習です。このタイプのランキング学習は、通常、ランキング学習の退化した形式であると考えられています。関係ペアベースのランキング学習は、アイテム セット内のアイテム間の関係を重視します。この章で説明するベイジアン パーソナライズ ランキング アルゴリズムは、このタイプのアルゴリズムに属します。リストベースのランキング学習は、アイテム セット内のアイテム リストの全体的なランキング関係を重視します。以降の章で説明するコラボレーティブ Less is More フィルタリング アルゴリズムは、このカテゴリに属します。このタイプのアルゴリズムは、アイテム セット内のアイテム スコアの全体的なランキング関係を最終的な最適化目標とします。

ベイジアン パーソナライズ ランキングの全体的な考え方は次のとおりです。現在、N 本のビデオがあり、それぞれのビデオには、ユーザーがクリックする、ユーザーがクリックしないという 2 つのユーザー ビヘイビアがあるとします。ここで、アイテムに対するユーザーによる評価を次のように設定します。ユーザーがクリックした動画のスコアは +1 となり、一部の動画はユーザーがクリックしていない動画からサンプリングされます。これらの動画はユーザーが好まない動画とみなされ、スコアは -1 となります。

ベイジアン パーソナライズ ランキングでは、まず、ユーザーによるアイテムの評価の背後にあるモデルが、行列分解モデルなどの一般的なモデルであると想定します。つまり、ユーザーによるアイテムの評価は R = U' * V となり、U はユーザー ベクトル、V はアイテム ベクトルとなります。アルゴリズムでは、スコアが +1 のすべての項目とスコアが -1 のすべての項目について、スコア マトリックス R を使用して項目を再スコアリングすると、元々スコアが +1 だった項目の新しいスコアは、元々スコアが -1 だった項目の新しいスコアよりも高くなると想定しています。

アルゴリズムの本質は、元の +1 項目スコアが -1 項目スコアよりも可能な限り高くなるという条件下で、R スコア分解後に U ベクトルと V ベクトルを推測することです。 ***U と V の積を計算することで、アイテムに対するユーザーの完全な評価マトリックスを取得し、アルゴリズムのプロセス全体を完了します。アルゴリズムについて詳しく説明しましょう。

まず、順序関係を定義します。ユーザーがアイテム I1 を気に入っているが、アイテム I2 を気に入っていない場合、順序関係 I1 >u I2 が存在します。評価マトリックスをパラメーター theta として定義し、最適化する必要があるベイズ モデルを構築します。 u が順序付きペア (I1、I2) を表し、尤度関数を解く式を次のように確立します。ここで、はシグモイド関数です。ここで定義されるベイズモデルは一般的なフレームワークであり、具体的なアルゴリズムモデルの実装は計算方法に依存します。

ベイジアン パーソナライズ ランキングによって最適化されるメトリックは AUC 関数です。ベイジアンパーソナライズドランキング問題では、AUC 関数は次の形式に簡略化されます。

確率的勾配降下法を使用してパラメータを解くと、次のようになります。

これは、アイテム i とアイテム j に対するユーザー u のスコアの差であることがわかります。確率的勾配降下法のプロセスにおけるパラメータ計算方法を取得しました。実際のアプリケーションでは、協調フィルタリングや行列分解などの特定のモデルに置き換えるだけで済みます。これらをそれぞれBPR-CF、BPR-MFなどのコード名で表します。

ここで、行列分解モデルによって計算されると仮定します。つまり = U'V = であり、確率的勾配降下法の式は次のようになります。

同様に、協調フィルタリングに基づく BPR の勾配降下法の式を取得できます。

BPR は 2 つの順序付きペアの関係を計算するため、実際の計算プロセスに含まれるデータの量は非常に大きくなる可能性があります。さらに、評価予測を行う際には膨大な行列演算が必要になります。通常、実際の計算プロセスでは、すべてのデータを使用して計算するのではなく、サンプリングなどの方法を採用して計算量を削減します。

BPR は、推奨システムにおけるペアベースのランキング学習において比較的重要な方法であり、推奨システムのさまざまな実践で広く使用されています。

[[260502]]

ブロックチェーン企業の科学者である王昊氏は、ユタ大学で学士号/修士号を取得し、国際経済貿易大学で実務MBAを取得しています。百度、新浪、網易、豆板などの企業で8年以上の技術研究開発の経験があり、恒昌立通のビッグデータ部門のディレクターを務めてきました。機械学習、データマイニング、コンピューターグラフィックス、科学的視覚化の専門家。 TVCGやASONAMなどの国際会議やジャーナルに10本の論文を発表している。私の学部論文は 2008 IEEE SMI *** 論文賞を受賞しました。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  負けても落ち込まないで! Google、ロボット工学プロジェクトを再開

>>:  機械学習における不均衡なクラスに対処するための 5 つの戦略

ブログ    
ブログ    
ブログ    

推薦する

AIは占いや顔分析ができるのか? 「IQ税」を払わないでください

「五十の大道あり、四十九は天から出たもの、人は一つを逃れる。」人々は未知のものに興味を持ち、その未知...

ディープラーニングの3つの主なステップ!

[[418456]]この記事は、Lee Hongyi によるチーム スタディ ブック「LeeML-...

ドローンレースが人間のトッププレイヤーを上回り、強化学習が再びネイチャーの表紙を飾る

最近、自律型ドローンがドローン競技会で人間のトッププレイヤーに勝利しました。この自律型ドローンは、チ...

深層強化学習について知っておくべきこと

[51CTO.com クイック翻訳] 現在、機械学習(ML)と人工知能(AI)に関連するアルゴリズム...

...

Toutiaoのアルゴリズムロジックを使用してMacOSを再設計しました

仕事以外では、私はほとんどの時間を2つの状態で過ごしています。1つは見出しを閲覧している状態で、もう...

GPT-4 には意識がありません!しかし、チューリング賞受賞者のベンジオ氏らの88ページの論文は、「スカイネット」が遅かれ早かれやってくることを示唆している。

今日まで人工知能は発展してきましたが、人工知能は意識を持っているのでしょうか?チューリング賞受賞者の...

組織内の AI スキルを向上させる 3 つのステップ

[[350689]]今日、ほとんどの組織は人工知能が遍在する世界に向けて準備を進めています。この進化...

...

Googleの2018年度PhDフェローシップが発表され、選ばれた8人の中国人学生は全員国内の大学を卒業した。

[[225280]] 2018年度Google PhDフェローシップ(北米、ヨーロッパ、中東)の候...

AI アバターが CES に登場! Samsung の Neon チャットボットは学習、進化、記憶が可能です!

サムスンの待望のスマートヒューマンプロジェクト「Neon」が、ついにCES 2020でデビューしまし...

最高年収は約56万! 2023年の最新のAIGC雇用動向レポートが発表されました

言うまでもなく、ChatGPT が過去 6 か月間でどれほど人気が​​あったかは誰もが知っています。...

人工知能技術が伝染病の予防と制御に役立つ

[[318426]]現在、人工知能技術は急速に発展しており、特に医療保健の分野では、生活の各分野で広...

OpenAIが安全チームを設置 準備: AIのリスクを評価し、外部からの悪用を防ぐ

OpenAIは10月27日、汎用人工知能(AGI)によって引き起こされる可能性のある壊滅的なリスクを...

Go データ構造とアルゴリズムの基本クイックソート

[[411577]]この記事はWeChatの公開アカウント「Light City」から転載したもので...