この記事はWeChatの公開アカウント「Big Data DT」から転載したもので、著者はLiu Qiangです。この記事を転載する場合は、Big Data DT パブリックアカウントにご連絡ください。 01 コンテンツベースの推奨推奨システムは、技術的な手段を使用してオブジェクトを人と関連付けます。オブジェクトには多くの属性が含まれます。ユーザーは、オブジェクトとのやり取りを通じて行動ログを生成します。これらの行動ログを使用して、オブジェクトに対するユーザーの好みを測定するラベルをマイニングできます (オブジェクトの属性を、そのオブジェクトを好むユーザーに割り当てて、ユーザーにこのラベルが付与されるようにします)。これらの好みのラベルに基づいてユーザーに推奨を行うのは、コンテンツ ベースの推奨アルゴリズムです。 動画の推奨を例に挙げてみましょう。動画には、タイトル、国、年、出演者、スタッフ、タグなどの情報が含まれています。ユーザーが以前に特定の種類の動画を視聴したことがある場合、そのユーザーはこれらの動画に興味があることを意味します。たとえば、ユーザーがホラー映画や SF 映画を好む場合、ユーザーの映画の好みはホラーまたは SF としてラベル付けされます。これらの興味特性に基づいて、ホラー映画や SF 映画をユーザーに推奨できます。 02 協調フィルタリングユーザーの製品に対するインタラクティブな行動は、ユーザーに痕跡を残します。「類は友を呼ぶ」というシンプルなアイデアを利用して、ユーザーにパーソナライズされた推奨事項を提供することができます。 具体的には、「人をグループに分ける」とは、ユーザーと同じ興味を持つ(似たような行動をとった)ユーザーを探し出し、同じ興味を持つユーザーが閲覧したオブジェクトをユーザーに推奨することを意味します。これがユーザーベースの協調フィルタリングアルゴリズムです。 「類は友を呼ぶ」とは、多くのユーザーが2つのオブジェクトに対して同じような好みを持っている場合、その2つのオブジェクトは「似ている」ということです。ユーザーが好んだオブジェクトに似たオブジェクトを推奨することで、ユーザーにパーソナライズされた推奨を提供できます。これがアイテムベースの協調フィルタリング推奨アルゴリズムです。 図 1-2 は、これら 2 種類の協調フィルタリング アルゴリズムを簡単に示しています。 ▲図1-2 協調フィルタリング推奨アルゴリズムの2つのタイプ 03 モデルベースの推奨一般的に言えば、ユーザーの行動記録、ユーザー関連情報(年齢、性別、地域、消費習慣など)、およびターゲットオブジェクト関連情報に基づいてアルゴリズムモデルを構築し、アイテムに対するユーザーの好みを予測することができます。一般的に使用されるアルゴリズムには、ロジスティック回帰、行列分解、分解マシンなどがあります。 ディープラーニング技術の発展に伴い、多くのディープラーニング関連のアルゴリズムがレコメンデーションシステムに適用され、良好な成果を生み出しています。 04 ソーシャル接続に基づく推奨私たちは日常生活の中で、本やレストラン、映画などを他の人に勧めたり、他の人に勧めてもらうことがよくあります。この推奨方法は、多くの場合、より効果的で、誰からも受け入れられやすいものです。 WeChatの「一目見る」モジュールの「読書」は、WeChatの友達が読んだ記事を表示しておすすめします。張小龍は2019年のWeChat8周年記念WeChat公開講座で、「一目見る」モジュールの「選択」よりも「読書」の方がはるかに優れており、「選択」はアルゴリズムによって行われたおすすめであると述べました。 これらの推奨アルゴリズムのうち、コンテンツベースの推奨と協調フィルタリングの推奨は、最も古く、最も一般的に使用されている推奨アルゴリズムです。実装が比較的簡単で、結果も良好です。業界で広く使用されています。 著者について: Liu Qiang、修士号、2009 年に中国科学技術大学数学部を卒業。彼はビッグデータと推奨システムに関する 12 年間の実務経験を持ち、エンタープライズ レベルの推奨システムの構築に精通しています。 DAU 1,000 万を超えるビデオ アプリ向けにレコメンデーション システムをゼロから構築しました。レコメンデーション システムによって生成されるトラフィックは、アプリ全体のトラフィックの 30% を占めています。過去3年間、当社は多くの中小規模のインターネット企業(ストリーミングメディア、オンライン教育、越境電子商取引など)に技術コンサルティングを提供し、レコメンデーションシステムをゼロから構築するお手伝いをしてきました。 この記事は「エンタープライズレベルの推奨システムの構築」から抜粋したもので、発行者の許可を得て公開されています。 |
<<: 将来のディープラーニングの鍵はフォトニックコンピューティング
昨日、TensorFlow は正式に発表しました: TensorFlow 2.9 がリリースされまし...
新しい研究(ETH チューリッヒによる)では次のことがわかりました。大規模モデルの「人間による検索」...
衛星が損傷を受けると、危険な宇宙ゴミになります。シンシナティ大学の学生たちは、損傷した衛星や宇宙船を...
1. 概要カスタム指示「カスタム指示」は ChatGPT の新機能です。カスタム指示を使用すると、自...
自然言語処理 (NLP) モデルは人間の言語を理解できず、テキストを反対の意味として解釈しますが、こ...
2月18日、海外メディアの報道によると、AppleはXcodeプログラミングソフトウェアの新しい生成...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
Insilico Medicine は、人工知能を使用して特発性肺線維症治療薬の新しいメカニズムを世...
事実は、データ技術の進歩と発展により、仮想カードと電子ウォレットが支払い管理により適したものになって...
序文深さ優先探索 (DFS) と幅優先探索は、グラフ理論における非常に重要な 2 つのアルゴリズムで...
私は長年、学界と産業界の両方で機械学習モデリングに取り組んできましたが、Scalable ML で「...
ここ数年、自動運転車に対する熱狂が高まっています。これは確かに合理的です。自動運転車は、燃費の向上、...