WeChatグループに広告を投稿する人が常にいるのでしょうか? Pythonを使って自動ロボットを作成し、彼を排除する

WeChatグループに広告を投稿する人が常にいるのでしょうか? Pythonを使って自動ロボットを作成し、彼を排除する

[[341536]]

WeChatグループ乾癬とは、WeChatグループ内の他のユーザーに恥ずかしげもなく広告を送信するユーザーのことを指します。彼らはWeChatグループの所有者が最も嫌う人々です。 Early Bird をよくご存知の読者の方は、私が技術交流グループを運営していることをご存知だと思いますが、このグループは設立以来、小さな広告に悩まされてきました。彼らは一般人に変装してグループに潜入し、グループに広告攻撃を続け、グループ内の技術交流の雰囲気を著しく乱しました。

あるいは、グループの全メンバーを黙って嫌がらせする。

何が彼らを、WeChatグループ最強の乾癬になるために妥協のない努力をさせるのかは明らかではありませんが(おそらくお金)、あまりにも多くの嫌がらせを経験した後、Pythonを使用してそれらを排除できるのではないかと考え始めました。

ラウンド1

実際、最初のアイデアは非常にシンプルです。それは 2 つのステップに分かれています。まず、これらの人々を正しく特定し、次に Python を使用して追い出します。

しかし、これら 2 つのステップはそれぞれ簡単ではありません。まず、これらのユーザーを正確に識別する最初のステップについて説明します。インターネット上にはデータがなく、適切な識別基準もありません。特徴認識を完了するには、自分の脳を使うしかありません。広告を投稿した約 100 人のユーザー サンプルを使用して数か月間トレーニングした後、私の「人工知能」は基本的に、異常なユーザーが以下の基準の少なくとも 3 つを満たしていると判断できます。

  • WeChat IDが設定されていません
  • プロフィール写真は人気者の女の子
  • WeChatの名前は特別な記号または絵文字です
  • Momentsに投稿されたことはありません
  • Momentsの背景画像がありません
  • 合格後はグループ参加申請以外の返答はありません

そして、過去のデータによると、1番目と3番目の項目を満たすユーザーは小さな広告のファンである可能性が高いため、次に行うことは、Pythonを使用してWeChatでこれらの人々を見つけるためのコードを記述することです。このルールをまとめた後、私は数年前にPythonを使用してWeChatの友達を研究したことがあり、wxpyまたはitchatの操作は複雑ではないはずなので、この要件を達成することは難しくないだろうと楽観的でしたが、事実は私がまだ若すぎることを証明しました。

いつからかは分かりませんが、これらのライブラリはまだインストールして使用できますが、WeChatは基本的にほとんどの人のWebバージョンのWeChatログイン権限を禁止しています。そのため、複数のWeChatアカウントを使用してQRコードをスキャンしてWeChatにログインすると、例外なくプロンプトが表示されます。

  1. <エラー> < ret > 1203 </ ret > <メッセージ>    
  2. アカウントのセキュリティのため、この WeChat ID では WeChat ウェブページにログインできなくなりました。  
  3. Windows WeChat または Mac WeChat を使用してコンピューターにログインできます。  
  4. </メッセージ> </エラー>  

これは頭​​の痛い問題です。何千人ものWeChatの友達を1人ずつ手動で確認することはできないので、他の解決策があるかどうか考え始めました。

第2ラウンド

Python クローラーを頻繁に作成する場合、場合によっては、Requests を使用して面倒なクロール防止対策を行うよりも、Selenium の方が操作が便利であることがわかっているでしょう。そこで、WeChat APIを使用するというアイデアが失敗したことがわかった後、私は比較的愚かな方法に注目しました————pynput

pynput は、Python を使用してコンピューターのマウスとキーボードを制御および監視するサードパーティ ライブラリです。この時点で、私が何をしたいのかがわかったと思います。API を使用してデータを直接取得することはできないため、Selenium と同様に、友達を 1 人ずつクリックする操作をシミュレートして、必要な操作を実現します。

このライブラリについて簡単に説明します。依存ライブラリがあまり多くないので、インストールはとても簡単です。pip install pynput を実行するだけです。使い方もとても簡単です。マウス操作は座標のみに依存します。デモを見てみましょう👇

上記の GIF デモと同様に、最初に pynput をインポートしてマウス コントローラーをインスタンス化し、ステータス バーの WeChat の位置を mouse.position に送信してマウスがその位置に移動するようにし、次に mouse.press を使用してマウス クリックをシミュレートして WeChat を自動的に開きます。そこで質問なのですが、目的の場所の座標をどうやって取得すればいいのでしょうか?少しずつ試すだけではだめです!

コントローラーを使用してマウスを制御するだけでなく、pynput はマウスを監視することもできます。たとえば、次のコードを使用すると、プログラムの起動後にマウスをクリックするたびにその位置を記録できます。

  1. pynputからマウスをインポート 
  2. on_move(x, y)を定義します。  
  3. print('マウスは{0}に移動します'.format(  
  4. (x,y)))
  5. def on_click(x, y, ボタン, 押された):  
  6. print('{0}、座標 {1}'.format('マウスクリック'、押されている場合は 'マウスを離す'、(x, y)))  
  7. 押されていない場合:  
  8. Falseを返す
  9. 真の場合:  
  10. リスナーとしてmouse.Listener( on_move on_move = on_move, on_click on_click = on_click) を使用します。  
  11. リスナー.join()

次のタスクは簡単です。WeChat ウィンドウを固定したまま、各キー位置 (WeChat アイコンの位置、グループ チャット ウィンドウの位置、個々のグループ メンバーのアバターの位置) の座標を記録するだけです。たとえば、上記の最初のルールを判断する場合、つまり各グループ メンバーの WeChat アカウントが設定されているかどうかを取得する場合は、次の操作をシミュレートしてそれを達成できます。

  • WeChatアプリをクリック
  • 希望のグループチャットをクリックします
  • 各グループメンバーのアバターを順番にクリックします。
  • WeChat IDの場所へ移動
  • WeChat IDをダブルクリックします
  • WeChat IDをコピーして、それが最初のWeChat IDであるかどうかを判断します。

上記のプロセスでは、最後のステップで、pynput のキーボード コントローラーを使用してコピーできることに言及する価値があります。対応する WeChat アカウントをダブルクリックして選択した後、次のコードを使用してキーボード入力 Command + C をシミュレートし、コピー操作を完了できます。

  1. pynput.keyboardからKeyをインポート 
  2. pynput.keyboardからControllerをController1としてインポートします。  
  3. キーボード=コントローラ1 ()  
  4. keyboard.pressed(Key.cmd) を使用すると:  
  5. キーボードで「c」を押します 
  6. キーボードを離す('c')

ただし、貼り付けには、別のエディターに貼り付けるためのコマンド+Cをシミュレートするためにpynputを使用する必要はありません。サードパーティのライブラリpyperclipを使用して、次の2行のコードでコピーしたテキストを直接文字列に変換できます。

  1. pyperclipをインポートする 
  2. pyperclip.paste()

グループメンバーのWeChat IDを文字列に変換した後、文字列の長さを判断したり、正規表現やその他の方法を使用したりすることで、メンバーのWeChat IDが最初のWeChat IDであるかどうかを簡単に判断し、ルール1の判断を実装できます。次のコードと動的な図は、最初のグループメンバーのWeChat IDを取得する完全なプロセスです。

  1. pynput.mouse からボタン、コントローラーをインポートします 
  2. インポート時間 
  3. pynput.keyboardからKeyをインポート 
  4. pynput.keyboardからControllerをController1としてインポートします。  
  5. pyperclipをインポートする 
  6. マウス=コントローラー()  
  7. # WeChatをクリック 
  8. マウスの位置= (1046.14453125, 4.546875)  
  9. 時間.スリープ(2)  
  10. マウスを押す(ボタンを左に押す)  
  11. マウスを離す(ボタンを左に離す)  
  12. #アバターをクリック 
  13. マウスの位置= (1194.140625, 441.05859375)  
  14. 時間.睡眠(1)  
  15. マウスを押す(ボタンを左に押す)  
  16. マウスを離す(ボタンを左に離す)  
  17. # クリックしてテキストを選択
  18. マウスの位置= (965.60546875, 284.0390625)  
  19. 時間.睡眠(1)  
  20. マウスクリック(ボタン左、2)  
  21. キーボード=コントローラ1 ()  
  22. keyboard.pressed(Key.cmd) を使用すると:  
  23. キーボードで「c」を押します 
  24. キーボードを離す('c')  
  25. 時間.睡眠(1)
  26. wechatid = pyperclip .paste()  
  27. print(f"WeChat ID {wechatid} は広告アカウントの疑いがあります" if len(wechatid) > 20 else f"WeChat ID {wechatid} は広告アカウントではありません")

Zao XiaoqiのWeChatアカウントが広告アカウントから正常に除外されたことがわかります。

次に、グループメンバー間の座標距離を記録し、ループしてスクロールまたはプルダウンをシミュレートして上記のプロセスを実行します。その後、ルール 1 に従ってグループメンバー全員の WeChat アカウントを判断し、異常なメンバーを見つけて個別に判断できます。

最終的に、広告アカウントであると疑われるWeChatアカウントが6件見つかりました。その後、他のルールに基づいた手動判断により、最終的に2人のユーザーが高リスクの広告ユーザーとして特定され、削除されました。

最後に

上記の操作により、2 つの疑わしい広告アカウントの排除に成功しましたが、全体としては失敗でした。本当に正しい人をキックしたかどうかを判断するのはまだ難しいからです。間違った人をキックした場合、ファンの数は-1になります。同時に、Pythonを使用してグループ内の乾癬を正確に見つけることは依然として非常に難しいことがわかります。pynputを使用すると、せいぜいWeChat名、WeChatアカウント、アバター(画像認識APIを使用)の判断を完了できますが、友達の輪に隠されたより多くの情報を抽出してマイニングすることは困難です。

同時に、pynput には Selenium と同じ欠点があります。つまり、実際の人の操作をシミュレートするため速度が遅く、位置決め方法が座標のみをサポートしているため、操作中に WeChat ウィンドウを移動できないようにする必要があります。そうしないと、以前に記録されたすべての要素が無効になります。開発者は、より多くの位置決め方法をアップグレードすることをお勧めします。

<<:  WeChat AIがHPおよびIntelと提携し、PC向け人工知能音声アシスタントを開発

>>:  Python 機械学習チュートリアル

ブログ    

推薦する

清華大学張北院士:融合乗算による第三世代人工知能の三空間融合モデルの解釈

人工知能は今どの段階に達しているのでしょうか?どのような問題や限界があるのか​​?どのように突破する...

データによると、ChatGPTのトラフィックは8月末から増加し始めており、これは主に新学期の始まりによるものである。

9月21日、第三者機関の最新の推計によると、人工知能チャットボット「ChatGPT」のトラフィック...

...

...

AIとWeb3の出会い: 2023年の技術革命

2023 年には、人工知能 (AI) と Web3 という 2 つの技術現象が引き続き議論の中心にな...

長さ 0.3 メートルのロボットが 99 フィートの高さまでジャンプできます。ネイチャー誌が、将来月面に着陸できるジャンプロボットを発表

世の中に不思議なことは何もありません。 「ボリューム」という言葉が最も重要視されるこの時代に、これま...

AI 駆動型スマートビルは将来のトレンドになるでしょうか?

人工知能 (AI) は、建物の管理と制御の方法に革命をもたらし、これまで以上に効率的でコスト効率の高...

2022年の最先端技術トップ10:将来ロボットは多用途化することが予想される

最近、アリババDAMOアカデミーは、2022年に最も注目に値する最先端技術トップ10をまとめました。...

非反復乱数列生成アルゴリズム

この記事では、ハッシュテーブルを使用して重複を排除する通常の方法よりもはるかに高速な、繰り返しのない...

AI応用分野トップ10: AIはかつてないほど優れている

1956 年のダートマス会議で AI が提案されて以来、AI 研究はいくつかの浮き沈みを経験してきま...

ZeroMat: データを一切使用せずにレコメンデーションシステムのコールドスタート問題を解決する

[[428372]] [51CTO.com からのオリジナル記事]推奨システムは、登場以来、学界や産...

...

...

ソフトウェアの欠陥予測のためのソフトウェア可視化と転移学習の活用

論文のデータセットとコードはオープンソース化されています: https://zenodo.org/r...

ハイリアンと手を携えてデジタル変革の道を議論する

モバイルインターネットの発展に伴い、企業の生産・運営プロセスで生成されるデータは、これまでにない爆発...