[51CTO.com クイック翻訳] 10年以上の開発を経て、推奨システムはインターネット業界でますます人気が高まっています。初期の頃は適切な製品形態がなかったものの、今日ではToutiaoやDouyinなどの商用製品で重要な役割を果たしており、推奨システムはインターネット企業や研究コミュニティの学者からますます注目を集めています。 初期の頃、推奨アルゴリズムは主にロジスティック回帰、協調フィルタリング、行列分解などのさまざまな単一モデルでした。その後、推奨アルゴリズムは GBDT + LR、GBDT + FM などのハイブリッド モデルへと進化しました。ディープラーニングの台頭により、ディープニューラルネットワークは推奨システムの開発にますます影響を与えるようになりました。 Huifeng Guo 氏と他の中国の学者は、IJCAI 2017 で「DeepFM: CTR 予測のための因子分解マシン ベースのニューラル ネットワーク」と題する論文を発表し、FM モデルとディープラーニング モデルを統合して推奨アルゴリズムを作成する方法を説明しました。 DeepFM には次の 3 つの利点があります。
DeepFM の入力データは、クリックスルー率の推定で一般的に使用される (X, y) タプルです。ここで、X はユーザーとアイテムを表す特徴ベクトル (数値以外のデータが含まれる場合があります)、y はクリック データ ラベルです。y = 1 はユーザーがアイテムをクリックしたことを意味し、y = 0 はユーザーがアイテムをクリックしなかったことを意味します。 DeepFM の予測関数は次のとおりです。これは、実際にはシグモイド関数を使用して、FM ベースの予測と DNN ベースの予測を融合します。アルゴリズム モデルの FM 部分を次の図に示します。 DNN 部分のアルゴリズム アーキテクチャを下図に示します。 ハイブリッド モデルでは、FM と DNN が同じ特徴埋め込みレイヤーを共有します。埋め込み層の構造を下図に示します。 埋め込み層によって取得されたベクトルは として記録され、後続の DNN 計算 、および に使用されます。 次に著者は、AUC や Log-loss などの評価基準を使用して、近年のさまざまなクリックスルー率予測方法をテスト データ セットで評価しました。評価結果を次の図に示します。 DeepFM と比較して、他のいくつかの CTR 予測方法には次のような欠点があります。
DeepFMの設計コンセプトはシンプルで、2016年のGoogleのワイド&ディープネットワーク方式に由来していますが、その効果は抜群です。推奨システムの登場以来、さまざまなモデル融合手法が設計されてきました。トピックモデルを修正する協調トピック回帰から、ブレンディングに基づく GBDT + LR、そしてその後のワイド&ディープネットワーク方式まで、アルゴリズムを設計するためのさまざまなアイデアを提供します。アルゴリズム自体は、モデル、データ、パラメータの両方を考慮する必要がある分野です。DeepFM は、モデルの設計方法の良い例を示しています。 原題: DeepFM: CTR 予測のための因子分解マシンベースのニューラル ネットワーク、著者: Huifeng Guo、Ruiming Tang、Yunming Ye、Zhenguo Li、Xiuqiang He
恒昌利通のシニアアーキテクトである王昊氏は、ユタ大学で修士号を取得しています。百度、新浪、網易、豆瓣などの企業で長年の研究開発および技術管理の経験を積んでいます。機械学習、ビッグデータ、推奨システム、ソーシャルネットワーク分析、コンピューターグラフィックス、視覚化などの技術に長けています。 TVCGやASONAMなどの国際会議やジャーナルに8本の論文を発表している。私の学部論文は 2008 IEEE SMI *** 論文賞を受賞しました。 [51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください] |
<<: 8年が経ちました。Googleが中国に戻るという噂は本当でしょうか?
>>: CNN が RNN に取って代わる?シーケンスモデリングで再帰ネットワークが不要になったとき
従来の RGB 画像はラスター形式で保存され、ピクセルは画像全体に均等に分散されます。ただし、この均...
[[392244]] 4月9日午後3時、「初の顔認識事件」は杭州市中級人民法院で二審判決を受けた。こ...
技術の進歩は、驚くべき速さでビジネスモデルを破壊する可能性があります。したがって、ビジネスリーダーに...
[[393927]] Raft は、リーダーを基準としてノード間のログの一貫性を実現するコンセンサス...
[[361220]] [51CTO.com クイック翻訳] 私たちはますます分断が進む世界に住んでい...
[[255272]]ビッグデータダイジェスト制作編集者: ゴウ・シャオバイ、チャン・チウユエ、アイリ...
[[407036]] [51CTO.com からのオリジナル記事]アルゴリズムの公平性は、近年、推奨...
[[259329]] 2018年上半期現在、中国には922社の人工知能企業があり、そのうち97%は今...
GPU が不足している人々は、その苦境に別れを告げようとしています。 NVIDIA は現在、H10...
自動車技術の継続的な向上とインターネット技術の普及に伴い、自動車に付与される機能はますます増えていま...
7月19日、「新バージョンの文心易言の性能はChatGPT 3.5を上回り、これは我が国の関連技術作...