よく使われる4つの推奨アルゴリズムの一覧

[[416976]]

この記事はWeChatの公開アカウント「Big Data DT」から転載したもので、著者はLiu Qiangです。この記事を転載する場合は、Big Data DT パブリックアカウントにご連絡ください。

01 コンテンツベースの推奨

推奨システムは、技術的な手段を使用してオブジェクトを人と関連付けます。オブジェクトには多くの属性が含まれます。ユーザーは、オブジェクトとのやり取りを通じて行動ログを生成します。これらの行動ログを使用して、オブジェクトに対するユーザーの好みを測定するラベルをマイニングできます (オブジェクトの属性を、そのオブジェクトを好むユーザーに割り当てて、ユーザーにこのラベルが付与されるようにします)。これらの好みのラベルに基づいてユーザーに推奨を行うのは、コンテンツベースの推奨アルゴリズムです。

動画の推奨を例に挙げてみましょう。動画には、タイトル、国、年、出演者、スタッフ、タグなどの情報が含まれています。ユーザーが以前に特定の種類の動画を視聴したことがある場合、そのユーザーはこれらの動画に興味があることを意味します。たとえば、ユーザーがホラー映画や SF 映画を好む場合、ユーザーの映画の好みはホラーまたは SF としてラベル付けされます。これらの興味特性に基づいて、ホラー映画や SF 映画をユーザーに推奨できます。

02 協調フィルタリング

ユーザーの製品に対するインタラクティブな行動は、ユーザーに痕跡を残します。「類は友を呼ぶ」というシンプルなアイデアを利用して、ユーザーにパーソナライズされた推奨事項を提供することができます。

具体的には、「人をグループに分ける」とは、ユーザーと同じ興味を持つ（似たような行動をとった）ユーザーを探し出し、同じ興味を持つユーザーが閲覧したオブジェクトをユーザーに推奨することを意味します。これがユーザーベースの協調フィルタリングアルゴリズムです。

「類は友を呼ぶ」とは、多くのユーザーが2つのオブジェクトに対して同じような好みを持っている場合、その2つのオブジェクトは「似ている」ということです。ユーザーが好んだオブジェクトに似たオブジェクトを推奨することで、ユーザーにパーソナライズされた推奨を提供できます。これがアイテムベースの協調フィルタリング推奨アルゴリズムです。

図 1-2 は、これら 2 種類の協調フィルタリングアルゴリズムを簡単に示しています。

▲図1-2 協調フィルタリング推奨アルゴリズムの2つのタイプ

03 モデルベースの推奨

一般的に言えば、ユーザーの行動記録、ユーザー関連情報（年齢、性別、地域、消費習慣など）、およびターゲットオブジェクト関連情報に基づいてアルゴリズムモデルを構築し、アイテムに対するユーザーの好みを予測することができます。一般的に使用されるアルゴリズムには、ロジスティック回帰、行列分解、分解マシンなどがあります。

ディープラーニング技術の発展に伴い、多くのディープラーニング関連のアルゴリズムがレコメンデーションシステムに適用され、良好な成果を生み出しています。

04 ソーシャル接続に基づく推奨

私たちは日常生活の中で、本やレストラン、映画などを他の人に勧めたり、他の人に勧めてもらうことがよくあります。この推奨方法は、多くの場合、より効果的で、誰からも受け入れられやすいものです。

WeChatの「一目見る」モジュールの「読書」は、WeChatの友達が読んだ記事を表示しておすすめします。張小龍は2019年のWeChat8周年記念WeChat公開講座で、「一目見る」モジュールの「選択」よりも「読書」の方がはるかに優れており、「選択」はアルゴリズムによって行われたおすすめであると述べました。

これらの推奨アルゴリズムのうち、コンテンツベースの推奨と協調フィルタリングの推奨は、最も古く、最も一般的に使用されている推奨アルゴリズムです。実装が比較的簡単で、結果も良好です。業界で広く使用されています。

著者について: Liu Qiang、修士号、2009 年に中国科学技術大学数学部を卒業。彼はビッグデータと推奨システムに関する 12 年間の実務経験を持ち、エンタープライズレベルの推奨システムの構築に精通しています。 DAU 1,000 万を超えるビデオアプリ向けにレコメンデーションシステムをゼロから構築しました。レコメンデーションシステムによって生成されるトラフィックは、アプリ全体のトラフィックの 30% を占めています。過去3年間、当社は多くの中小規模のインターネット企業（ストリーミングメディア、オンライン教育、越境電子商取引など）に技術コンサルティングを提供し、レコメンデーションシステムをゼロから構築するお手伝いをしてきました。

この記事は「エンタープライズレベルの推奨システムの構築」から抜粋したもので、発行者の許可を得て公開されています。

<<: 将来のディープラーニングの鍵はフォトニックコンピューティング

>>: 人工知能はどのような通信分野に応用されていますか?