WeChatの「Take a Look」アプリの最もアクティブなユーザーは実は私たちの両親であり、最も「静か」なのは若者たちです...清華大学のTang Jie氏らによる最近の研究では、WeChatの「Take a Look」アプリのデータを使用して、記事を読むためにクリックしたり、「読む」をクリックしたりするユーザーの行動パターンを分析し、人口統計、2元および3元の関連、自己中心的なネットワーク構造など、さまざまな側面から分析を行いました。 この研究では、他の方法と比較して予測精度が向上した予測モデルも提案されました。現在、この論文はIEEE Transactions on Knowledge and Data Engineering (TKDE)誌に掲載されています。
WeChatの記事にある「読む」ボタンは皆さんもよくご存知だと思います。 WeChat ユーザーは、ディスカバリー ページで [見てみる] をクリックすると、友人が [読んでいる] をクリックした記事を見ることができます。また、これらの記事をクリックして読んだり、[読んでいる] をクリックしたりすることもできます。 WeChatの「Take a Look」ページの例。 (「わぁボタン」は「視聴」ボタンです。) では、これらの記事を読むためにクリックしたり、「読む」をクリックしたりするユーザーの行動に影響を与える要因は何でしょうか? 「Look」ユーザーの行動に影響を与える要因は何ですか?この研究は3つのレベルで分析されました。
具体的な分析結果は以下の通りです。 ユーザーの人口統計情報表 1、図 2、図 3 は、さまざまな性別と年齢のユーザーが「読む」をクリックする確率と、「見てみる」機能で記事を読むためにクリックする確率を示しています。このことから、次のことがわかります。
二項関係と三項関係便宜上、この研究では、二項関係ではユーザーと 1 人のアクティブな友人とのやり取りのみを考慮し、三項関係ではユーザーと 2 人のアクティブな友人とのやり取りのみを考慮します。研究者らは、人口統計学的属性と社会的役割という2つの側面から分析を行った。 1. 二項関係と人口統計的属性 以下の表 2 は、ユーザーの性別と友人の性別がユーザーのアクティビティ率に与える影響を示しています。このことから、クリック行動に関しては、2 人が同じ性別の場合、ユーザーのクリック確率が高くなることがわかります。ただし、「視聴」行動に関しては、友人が女性の場合、ユーザーが「視聴」をクリックする確率は高くなります。 年齢の観点から見ると、下の図 4 は、ユーザーの年齢と友人の年齢がユーザーの「視聴」行動の確率に与える影響を示しています。このことから、ユーザーが若い場合 (40 歳未満)、同世代のユーザーよりも年上の友人の影響を受けやすく、年上のユーザーは同世代のユーザーから影響を受けやすいことがわかります。 2. 二元的関係と社会的役割 以下の表 4 は、ユーザーとその友人がオピニオン リーダー (OL) と一般人 (OU) という異なる社会的役割を持っている場合に、ユーザーのアクティビティ レートに与える影響を示しています。このことから、アクティブな友人がオピニオンリーダーでない場合、ユーザーは「読んでいる」をクリックして記事を読む可能性が高くなることがわかります。 以下の表 5 は、構造的ホール (SH) と一般人 (OU) という 2 つの社会的役割がユーザーのアクティビティ率に与える影響を示しています。 (「構造的穴」とは、ソーシャルネットワークのギャップを指します。つまり、ソーシャルネットワーク内の1人または数人の個人は、一部の個人とは直接接触していますが、他の個人とは直接接触していません。つまり、直接的な関係がないか、関係が不連続です。ネットワーク全体の観点から見ると、ネットワーク構造に穴があるように見えます。) 友達が構造上の穴になっている場合、一般ユーザーの活動率が高くなることがわかります。構造的ホールを持つユーザーの場合、友人に構造的ホールがない場合にクリック確率が高くなりますが、その差は有意ではありません。 3. 三元関係と人口統計的属性 下の図 5 は、ユーザーの性別と友人の性別がユーザーのアクティビティ率に与える影響を示しています。 2 人の友人の性別がユーザーの性別と同じ場合、ユーザーのアクティビティ率が最も高くなることがわかります。これは強い同質性を示しています。 下の図 6 は、ユーザー年齢と友人年齢がユーザーアクティビティ率に与える影響を示しています。このことから、友人の 1 人がユーザーと同じ年齢で、もう 1 人が若い場合、ユーザーのアクティビティ率が高く、年上のユーザーは年下のユーザーに多くの注意を払うことがわかります。 自己中心的ネットワークの特性さらに、研究者らは、ユーザーの活動とエゴセントリック ネットワークの属性との関係も調査し、ユーザーのオンライン行動 (クリックして読む、および「読む」) は友人の輪 (エゴセントリック ネットワーク内の友人) に大きく影響されることを発見しました。エゴセントリック ネットワークとは、ユーザーのアクティブな友人の誘導されたサブグラフを指します。 この研究では、エゴセントリックネットワーク内の友人の数、接続されたブランチの数(#CC)、およびクリーンなエゴセントリックネットワーク(kコアサブグラフ)内の#CCという3つの側面からエゴセントリックネットワークの特性を分析します。 下の図 8 は、アクティブな友達の数を増やすことがユーザーのアクティビティ率に与える影響を示しています。図からわかるように、クリックと「閲覧」の行動の傾向はまったく異なります。 これらの分析を通じて、研究者は次のことを発見しました。
予測モデルいくつかのパターンや規則性を発見しましたが、それらを使用してユーザーのオンライン行動を予測することはできるでしょうか?この研究では、予測モデル DiffuseGNN が作成されました。 上図に示すように、DiffuseGNN モデルは、前処理エゴセントリック ネットワーク、入力層、特徴スムージング層、階層グラフ表現学習、出力層の 5 つのステップで構成されています。 このモデルのコアコンポーネントと基本的な考え方は次のとおりです。
実験研究者らは、収集したWeChatの「Look」データと公開されているWeiboデータセットでモデルのユーザー行動に対する予測効果をテストし、比較のために1)従来の分類器:LRとRF、2)機能の相互作用をモデル化するディープラーニング手法:xDeepFM、3)エゴセントリックネットワークに基づくSOTAユーザー行動予測手法:DeepInfとWangら、4)階層的グラフ表現学習手法:SAGPool、ASAP、StructPoolなど、複数の手法を選択しました。このうち、3番目と4番目のカテゴリはGNNベースの手法です。 以下の表 7 は実験結果を示しており、DiffuseGNN モデルのパフォーマンスがベースライン メソッドを一貫して上回っていることがわかります。 さらに、この研究では、さまざまなモデルコンポーネントがユーザー行動の予測に与える影響についても調査しました。表 7 の下部にあるデータを参照してください。このことから、事前トレーニング済みの埋め込みと特徴の平滑化のステップを削除すると、パフォーマンスが大幅に低下することがわかります。2 次特徴を追加すると、WeChat データに基づくユーザー行動予測にわずかに役立ち、Weibo データセットに基づくユーザー行動予測にはより良い効果があります。モデルは、人工的に作成されたユーザー特徴を使用せずに優れたパフォーマンスも達成します。 |
<<: AI イニシアチブを成功させるために必要な 10 のこと
>>: 人間の介入によってモデルのパフォーマンスをどのように向上できるでしょうか?この記事を読んでみてください
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
ディープラーニングの人気は、基本的に人々の計算能力の追求によるものです。最近、MIT は警告を発しま...
今日、工業製造業は産業用人工知能への依存度が高まっており、業務上の意思決定者はこれをデジタル変革戦略...
[51CTO.com クイック翻訳]テクノロジーの進歩と発展により、バーチャル試着室が人々の生活に入...
清華大学の卒業生 2 人によって作成されたこのツールは、ツールの使用においてGPT-4 の主要な利点...
重要な実現技術である AI の急速な成功により、より広範なデジタル変革とイノベーションの取り組みへの...
企業がデジタル変革を進める際に、生成 AI がいかにして企業の生産性を向上させることができるかについ...
機械学習の話題は誰もが話題にするほど普及していますが、それを完全に理解している人はほとんどいません。...
[[183558]]誰かがあなたにボールを投げてきたら、どうしますか? もちろん、すぐにキャッチす...
ChatGPT によって開始された AI の波は私たちを人工知能の時代へと導き、言語モデルは日常生活...
1 月 19 日、テクノロジー業界が超人的、神レベルの知能を達成する道を歩んでいるという確固たる信念...
1. ビジネスサークル1. BMWがデータ侵害を認める:BMWクラウドストレージサーバーの構成エラー...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
データの問題は、企業の AI プロジェクトが意図した目標を達成できない主な理由です。しかし、企業が失...