ベイジアンパーソナライズランキングアルゴリズムを1つの記事で理解する

ベイジアンパーソナライズランキングアルゴリズムを1つの記事で理解する

[[260485]]

[51CTO.com からのオリジナル記事] 哲学にさまざまな流派があるように、推奨システムのアルゴリズム設計の考え方もさまざまな流派に分けられます。ランキング学習は、こうした考え方の 1 つにすぎません。 RecSys などの国際的な推奨システム会議に精通している実務家は、2010 年以降、ランキング学習に基づく推奨システム アルゴリズムが多数登場していることに気付くかもしれません。ベイジアン・パーソナライズド・ランキング (BPR) からそれに続く Collaborative Less is More Filtering (CLiMF)、そして GapFM や XCLiMF などの他のアルゴリズムに至るまで、推奨システムの分野では百花繚乱の状況が続いています。

ランキング学習と協調フィルタリング、行列分解とそれに続くディープラーニングの設計思想の主な違いは、ランキング学習では推奨システムをランキングの問題として捉えている点です。つまり、ユーザーに商品をどのように推奨するかという問題は、ユーザーが好む可能性のある商品セット内で商品をどのように並べ替えるかという問題になります。このプロセスでは、アルゴリズムはユーザーが好むアイテムの評価を正確に予測することに重点を置くのではなく、アイテム間の連続的な関係を最適化の目標とします。

ランキング学習の英語名は Learning to Rank です。最適化の目的の違いにより、ポイントワイズランキング学習、ペアワイズランキング学習、リストワイズランキング学習の 3 つのカテゴリに分類されます。ポイントベースのランキング学習は、本質的には従来の分類アルゴリズムです。たとえば、SVM とロジスティック回帰はすべてポイントベースのランキング学習です。このタイプのランキング学習は、通常、ランキング学習の退化した形式であると考えられています。関係ペアベースのランキング学習は、アイテム セット内のアイテム間の関係を重視します。この章で説明するベイジアン パーソナライズ ランキング アルゴリズムは、このタイプのアルゴリズムに属します。リストベースのランキング学習は、アイテム セット内のアイテム リストの全体的なランキング関係を重視します。以降の章で説明するコラボレーティブ Less is More フィルタリング アルゴリズムは、このカテゴリに属します。このタイプのアルゴリズムは、アイテム セット内のアイテム スコアの全体的なランキング関係を最終的な最適化目標とします。

ベイジアン パーソナライズ ランキングの全体的な考え方は次のとおりです。現在、N 本のビデオがあり、それぞれのビデオには、ユーザーがクリックする、ユーザーがクリックしないという 2 つのユーザー ビヘイビアがあるとします。ここで、アイテムに対するユーザーによる評価を次のように設定します。ユーザーがクリックした動画のスコアは +1 となり、一部の動画はユーザーがクリックしていない動画からサンプリングされます。これらの動画はユーザーが好まない動画とみなされ、スコアは -1 となります。

ベイジアン パーソナライズ ランキングでは、まず、ユーザーによるアイテムの評価の背後にあるモデルが、行列分解モデルなどの一般的なモデルであると想定します。つまり、ユーザーによるアイテムの評価は R = U' * V となり、U はユーザー ベクトル、V はアイテム ベクトルとなります。アルゴリズムでは、スコアが +1 のすべての項目とスコアが -1 のすべての項目について、スコア マトリックス R を使用して項目を再スコアリングすると、元々スコアが +1 だった項目の新しいスコアは、元々スコアが -1 だった項目の新しいスコアよりも高くなると想定しています。

アルゴリズムの本質は、元の +1 項目スコアが -1 項目スコアよりも可能な限り高くなるという条件下で、R スコア分解後に U ベクトルと V ベクトルを推測することです。 ***U と V の積を計算することで、アイテムに対するユーザーの完全な評価マトリックスを取得し、アルゴリズムのプロセス全体を完了します。アルゴリズムについて詳しく説明しましょう。

まず、順序関係を定義します。ユーザーがアイテム I1 を気に入っているが、アイテム I2 を気に入っていない場合、順序関係 I1 >u I2 が存在します。評価マトリックスをパラメーター theta として定義し、最適化する必要があるベイズ モデルを構築します。 u が順序付きペア (I1、I2) を表し、尤度関数を解く式を次のように確立します。ここで、はシグモイド関数です。ここで定義されるベイズモデルは一般的なフレームワークであり、具体的なアルゴリズムモデルの実装は計算方法に依存します。

ベイジアン パーソナライズ ランキングによって最適化されるメトリックは AUC 関数です。ベイジアンパーソナライズドランキング問題では、AUC 関数は次の形式に簡略化されます。

確率的勾配降下法を使用してパラメータを解くと、次のようになります。

これは、アイテム i とアイテム j に対するユーザー u のスコアの差であることがわかります。確率的勾配降下法のプロセスにおけるパラメータ計算方法を取得しました。実際のアプリケーションでは、協調フィルタリングや行列分解などの特定のモデルに置き換えるだけで済みます。これらをそれぞれBPR-CF、BPR-MFなどのコード名で表します。

ここで、行列分解モデルによって計算されると仮定します。つまり = U'V = であり、確率的勾配降下法の式は次のようになります。

同様に、協調フィルタリングに基づく BPR の勾配降下法の式を取得できます。

BPR は 2 つの順序付きペアの関係を計算するため、実際の計算プロセスに含まれるデータの量は非常に大きくなる可能性があります。さらに、評価予測を行う際には膨大な行列演算が必要になります。通常、実際の計算プロセスでは、すべてのデータを使用して計算するのではなく、サンプリングなどの方法を採用して計算量を削減します。

BPR は、推奨システムにおけるペアベースのランキング学習において比較的重要な方法であり、推奨システムのさまざまな実践で広く使用されています。

[[260502]]

ブロックチェーン企業の科学者である王昊氏は、ユタ大学で学士号/修士号を取得し、国際経済貿易大学で実務MBAを取得しています。百度、新浪、網易、豆板などの企業で8年以上の技術研究開発の経験があり、恒昌立通のビッグデータ部門のディレクターを務めてきました。機械学習、データマイニング、コンピューターグラフィックス、科学的視覚化の専門家。 TVCGやASONAMなどの国際会議やジャーナルに10本の論文を発表している。私の学部論文は 2008 IEEE SMI *** 論文賞を受賞しました。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  負けても落ち込まないで! Google、ロボット工学プロジェクトを再開

>>:  機械学習における不均衡なクラスに対処するための 5 つの戦略

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

JavaScript ChatGPT プラグインの構築、学習しましたか?

チャット プラグイン システムは、ChatGPT の機能を拡張し、独自のビジネス データを組み込み、...

ジャック・マーがまた一人の世界クラスの科学者を採用しました。春節期間中に電車の切符を買うときにシステムクラッシュを心配する必要はもうありません!

アリババが中国だけでなく国際的にも素晴らしいインターネット企業であることは誰もが知っています。しかし...

再帰アルゴリズムと最適化アルゴリズムの比較

以前、「【インタビュー】 - 低速反応再帰」で 3 つの再帰アルゴリズムを読みました。フィボナッチ数...

強くお勧めします!国内無料チャットGPT

導入GPT4がリリースされてから半年以上が経ち、皆さんもある程度は理解できたかと思います。しかし一方...

...

復旦大学の邱希鵬さんへの10の質問:大手モデルはAndroidの時代に入り、国産モデルがLIamaに取って代わることを望みます

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

パンデミックにより、AI のステータスは「欲しいもの」から「必須のもの」に変化したのでしょうか?

パンデミック以前は、AIの導入は世間の関心を集めていたものの、人々はまだAIの長所と短所、ビジネスへ...

...

中国の創作力はGPT-4を超える、「最高の文章力」を持つ中国のビッグモデルWeaverが登場

ChatGPT などの一般的な大規模モデルは数百の機能をサポートしていますが、一般的な日常的なユーザ...

ビル・ゲイツ:AIが最大の影響を与えるには何十年もかかる

[[271684]]ビル・ゲイツは、世界を変えるトレンドを予見し、それを活用することで、史上最も成功...

AIが高度な数学の核心を突破、微分方程式と不定積分を1秒以内に解き、その性能はMatlabをはるかに上回る

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

MITの最新の成果:AIが人間の脳が言語を処理する仕組みを解明

最新世代の予測言語モデルは、言語の根底にある意味の一部も学習したようです。驚くべきことに、これらのモ...