WeChatグループに広告を投稿する人が常にいるのでしょうか? Pythonを使って自動ロボットを作成し、彼を排除する

WeChatグループに広告を投稿する人が常にいるのでしょうか? Pythonを使って自動ロボットを作成し、彼を排除する

[[341536]]

WeChatグループ乾癬とは、WeChatグループ内の他のユーザーに恥ずかしげもなく広告を送信するユーザーのことを指します。彼らはWeChatグループの所有者が最も嫌う人々です。 Early Bird をよくご存知の読者の方は、私が技術交流グループを運営していることをご存知だと思いますが、このグループは設立以来、小さな広告に悩まされてきました。彼らは一般人に変装してグループに潜入し、グループに広告攻撃を続け、グループ内の技術交流の雰囲気を著しく乱しました。

あるいは、グループの全メンバーを黙って嫌がらせする。

何が彼らを、WeChatグループ最強の乾癬になるために妥協のない努力をさせるのかは明らかではありませんが(おそらくお金)、あまりにも多くの嫌がらせを経験した後、Pythonを使用してそれらを排除できるのではないかと考え始めました。

ラウンド1

実際、最初のアイデアは非常にシンプルです。それは 2 つのステップに分かれています。まず、これらの人々を正しく特定し、次に Python を使用して追い出します。

しかし、これら 2 つのステップはそれぞれ簡単ではありません。まず、これらのユーザーを正確に識別する最初のステップについて説明します。インターネット上にはデータがなく、適切な識別基準もありません。特徴認識を完了するには、自分の脳を使うしかありません。広告を投稿した約 100 人のユーザー サンプルを使用して数か月間トレーニングした後、私の「人工知能」は基本的に、異常なユーザーが以下の基準の少なくとも 3 つを満たしていると判断できます。

  • WeChat IDが設定されていません
  • プロフィール写真は人気者の女の子
  • WeChatの名前は特別な記号または絵文字です
  • Momentsに投稿されたことはありません
  • Momentsの背景画像がありません
  • 合格後はグループ参加申請以外の返答はありません

そして、過去のデータによると、1番目と3番目の項目を満たすユーザーは小さな広告のファンである可能性が高いため、次に行うことは、Pythonを使用してWeChatでこれらの人々を見つけるためのコードを記述することです。このルールをまとめた後、私は数年前にPythonを使用してWeChatの友達を研究したことがあり、wxpyまたはitchatの操作は複雑ではないはずなので、この要件を達成することは難しくないだろうと楽観的でしたが、事実は私がまだ若すぎることを証明しました。

いつからかは分かりませんが、これらのライブラリはまだインストールして使用できますが、WeChatは基本的にほとんどの人のWebバージョンのWeChatログイン権限を禁止しています。そのため、複数のWeChatアカウントを使用してQRコードをスキャンしてWeChatにログインすると、例外なくプロンプトが表示されます。

  1. <エラー> < ret > 1203 </ ret > <メッセージ>    
  2. アカウントのセキュリティのため、この WeChat ID では WeChat ウェブページにログインできなくなりました。  
  3. Windows WeChat または Mac WeChat を使用してコンピューターにログインできます。  
  4. </メッセージ> </エラー>  

これは頭​​の痛い問題です。何千人ものWeChatの友達を1人ずつ手動で確認することはできないので、他の解決策があるかどうか考え始めました。

第2ラウンド

Python クローラーを頻繁に作成する場合、場合によっては、Requests を使用して面倒なクロール防止対策を行うよりも、Selenium の方が操作が便利であることがわかっているでしょう。そこで、WeChat APIを使用するというアイデアが失敗したことがわかった後、私は比較的愚かな方法に注目しました————pynput

pynput は、Python を使用してコンピューターのマウスとキーボードを制御および監視するサードパーティ ライブラリです。この時点で、私が何をしたいのかがわかったと思います。API を使用してデータを直接取得することはできないため、Selenium と同様に、友達を 1 人ずつクリックする操作をシミュレートして、必要な操作を実現します。

このライブラリについて簡単に説明します。依存ライブラリがあまり多くないので、インストールはとても簡単です。pip install pynput を実行するだけです。使い方もとても簡単です。マウス操作は座標のみに依存します。デモを見てみましょう👇

上記の GIF デモと同様に、最初に pynput をインポートしてマウス コントローラーをインスタンス化し、ステータス バーの WeChat の位置を mouse.position に送信してマウスがその位置に移動するようにし、次に mouse.press を使用してマウス クリックをシミュレートして WeChat を自動的に開きます。そこで質問なのですが、目的の場所の座標をどうやって取得すればいいのでしょうか?少しずつ試すだけではだめです!

コントローラーを使用してマウスを制御するだけでなく、pynput はマウスを監視することもできます。たとえば、次のコードを使用すると、プログラムの起動後にマウスをクリックするたびにその位置を記録できます。

  1. pynputからマウスをインポート 
  2. on_move(x, y)を定義します。  
  3. print('マウスは{0}に移動します'.format(  
  4. (x,y)))
  5. def on_click(x, y, ボタン, 押された):  
  6. print('{0}、座標 {1}'.format('マウスクリック'、押されている場合は 'マウスを離す'、(x, y)))  
  7. 押されていない場合:  
  8. Falseを返す
  9. 真の場合:  
  10. リスナーとしてmouse.Listener( on_move on_move = on_move, on_click on_click = on_click) を使用します。  
  11. リスナー.join()

次のタスクは簡単です。WeChat ウィンドウを固定したまま、各キー位置 (WeChat アイコンの位置、グループ チャット ウィンドウの位置、個々のグループ メンバーのアバターの位置) の座標を記録するだけです。たとえば、上記の最初のルールを判断する場合、つまり各グループ メンバーの WeChat アカウントが設定されているかどうかを取得する場合は、次の操作をシミュレートしてそれを達成できます。

  • WeChatアプリをクリック
  • 希望のグループチャットをクリックします
  • 各グループメンバーのアバターを順番にクリックします。
  • WeChat IDの場所へ移動
  • WeChat IDをダブルクリックします
  • WeChat IDをコピーして、それが最初のWeChat IDであるかどうかを判断します。

上記のプロセスでは、最後のステップで、pynput のキーボード コントローラーを使用してコピーできることに言及する価値があります。対応する WeChat アカウントをダブルクリックして選択した後、次のコードを使用してキーボード入力 Command + C をシミュレートし、コピー操作を完了できます。

  1. pynput.keyboardからKeyをインポート 
  2. pynput.keyboardからControllerをController1としてインポートします。  
  3. キーボード=コントローラ1 ()  
  4. keyboard.pressed(Key.cmd) を使用すると:  
  5. キーボードで「c」を押します 
  6. キーボードを離す('c')

ただし、貼り付けには、別のエディターに貼り付けるためのコマンド+Cをシミュレートするためにpynputを使用する必要はありません。サードパーティのライブラリpyperclipを使用して、次の2行のコードでコピーしたテキストを直接文字列に変換できます。

  1. pyperclipをインポートする 
  2. pyperclip.paste()

グループメンバーのWeChat IDを文字列に変換した後、文字列の長さを判断したり、正規表現やその他の方法を使用したりすることで、メンバーのWeChat IDが最初のWeChat IDであるかどうかを簡単に判断し、ルール1の判断を実装できます。次のコードと動的な図は、最初のグループメンバーのWeChat IDを取得する完全なプロセスです。

  1. pynput.mouse からボタン、コントローラーをインポートします 
  2. インポート時間 
  3. pynput.keyboardからKeyをインポート 
  4. pynput.keyboardからControllerをController1としてインポートします。  
  5. pyperclipをインポートする 
  6. マウス=コントローラー()  
  7. # WeChatをクリック 
  8. マウスの位置= (1046.14453125, 4.546875)  
  9. 時間.スリープ(2)  
  10. マウスを押す(ボタンを左に押す)  
  11. マウスを離す(ボタンを左に離す)  
  12. #アバターをクリック 
  13. マウスの位置= (1194.140625, 441.05859375)  
  14. 時間.睡眠(1)  
  15. マウスを押す(ボタンを左に押す)  
  16. マウスを離す(ボタンを左に離す)  
  17. # クリックしてテキストを選択
  18. マウスの位置= (965.60546875, 284.0390625)  
  19. 時間.睡眠(1)  
  20. マウスクリック(ボタン左、2)  
  21. キーボード=コントローラ1 ()  
  22. keyboard.pressed(Key.cmd) を使用すると:  
  23. キーボードで「c」を押します 
  24. キーボードを離す('c')  
  25. 時間.睡眠(1)
  26. wechatid = pyperclip .paste()  
  27. print(f"WeChat ID {wechatid} は広告アカウントの疑いがあります" if len(wechatid) > 20 else f"WeChat ID {wechatid} は広告アカウントではありません")

Zao XiaoqiのWeChatアカウントが広告アカウントから正常に除外されたことがわかります。

次に、グループメンバー間の座標距離を記録し、ループしてスクロールまたはプルダウンをシミュレートして上記のプロセスを実行します。その後、ルール 1 に従ってグループメンバー全員の WeChat アカウントを判断し、異常なメンバーを見つけて個別に判断できます。

最終的に、広告アカウントであると疑われるWeChatアカウントが6件見つかりました。その後、他のルールに基づいた手動判断により、最終的に2人のユーザーが高リスクの広告ユーザーとして特定され、削除されました。

最後に

上記の操作により、2 つの疑わしい広告アカウントの排除に成功しましたが、全体としては失敗でした。本当に正しい人をキックしたかどうかを判断するのはまだ難しいからです。間違った人をキックした場合、ファンの数は-1になります。同時に、Pythonを使用してグループ内の乾癬を正確に見つけることは依然として非常に難しいことがわかります。pynputを使用すると、せいぜいWeChat名、WeChatアカウント、アバター(画像認識APIを使用)の判断を完了できますが、友達の輪に隠されたより多くの情報を抽出してマイニングすることは困難です。

同時に、pynput には Selenium と同じ欠点があります。つまり、実際の人の操作をシミュレートするため速度が遅く、位置決め方法が座標のみをサポートしているため、操作中に WeChat ウィンドウを移動できないようにする必要があります。そうしないと、以前に記録されたすべての要素が無効になります。開発者は、より多くの位置決め方法をアップグレードすることをお勧めします。

<<:  WeChat AIがHPおよびIntelと提携し、PC向け人工知能音声アシスタントを開発

>>:  Python 機械学習チュートリアル

ブログ    
ブログ    
ブログ    

推薦する

OpenAIは人間の参照要約よりも優れており、人間のフィードバックを利用して要約生成の品質を向上させています。

言語モデルがより強力になるにつれて、特定のタスクのデータとメトリックがトレーニングと評価のボトルネッ...

機械学習アルゴリズム(1):決定木とランダムフォレスト

モデルの組み合わせ (ブースティング、バギングなど) と決定木に関連するアルゴリズムは多数あります。...

...

AI+IoT: インテリジェント IoT (インダストリー 4.0 を含む) の需要が高い 5 つの業界

未来のスマートワールドでは、あらゆるものがモノのインターネットでつながり、あらゆるものがインテリジェ...

Google の大きな動き!新しくリリースされた Cloud AutoML により、コードを書かずに AI トレーニングを完全自動化

これは大問題だ! Google が大きな動きを見せました!昨日、フェイフェイ・リーとジェフ・ディーン...

2020年に人工知能はどのように発展するでしょうか?機械学習のトップ専門家が予測するトレンド

[[311763]]人工知能はもはや、いつか世界を変える準備をしているのではなく、すでに世界を変えて...

ディープニューラルネットワーク (DNN) は人間の大脳皮質の構造をシミュレートしますか?

[[199788]]私は生物学を専攻する学部生であり、認知神経科学を専攻する大学院生です。余暇には...

旅行を恥ずかしがる必要はありません。国内の観光地がAIを導入し、スマートな旅行の新たなシナリオを実現

旅行に出かけることは、祖国の美しい川や山を鑑賞し、「詩と遠い場所」を追求することです。 AIの助けに...

テックネオテクノロジーサロ​​ン - 第14号 - アルゴリズムに基づくIT運用・保守の実践と探究

【51CTO.comオリジナル記事】 [51CTO オリジナル記事、パートナーサイトに転載する場合は...

AI はあなたの仕事を奪うだけでなく、もっと恐ろしい脅威をもたらす可能性があります...

ビッグデータ時代の到来は、ビッグデータの波だけでなく、人工知能の台頭ももたらします。グーグルの人工知...

謎の日本人男性がコードを自動的に削除できるAIを開発し、業界に衝撃を与える

[[317093]]モザイクは、一般的に広く使用されている画像/ビデオ処理方法であり、画像/ビデオ内...

李開復氏:反復労働の代替として、農村地域はAIロボットの着陸に最適な場所

人工知能技術は農業にどのような力を与えるのでしょうか?将来、農業に変化をもたらす最も重要な技術は何で...

スタンフォード大学: 人工知能に関する 4 年間の学部課程一覧

最近、数年間業界で働いているスタンフォード大学の AI 卒業生が、AI と機械学習のキャリアのために...