リアルタイムで「顔」をぼかす!実践的なチュートリアル

リアルタイムで「顔」をぼかす!実践的なチュートリアル

みなさんこんにちは。今日は実践的なチュートリアルを皆さんと共有したいと思います。

いつものように、まずは結果を見てみましょう(目標があることを確認してください)。

顔認識技術の発達により、私たちの日常生活は大きく便利になりましたが、プライバシーの問題もあります。そして、犯罪者が違法行為を行うために利用される可能性もあります。

そのため、多くのビデオブロガーは通行人の画像をぼかします。しかし、手動でコーディングするのは非常に面倒な作業です。1 フレームの画像であれば比較的簡単ですが、ビデオのフレーム レートが 25FPS、つまり 1 秒間に 25 フレームの画像があると仮定すると、数分間のビデオの場合、作業量も非常に膨大になります。

そこで、プログラムを使って、このような操作を自動で実行してみます!

Opencv、Mediapipe、Python を使用して、顔をリアルタイムでぼかすことができます。

これは 2 つのステップで実行できます。

  • コーディングする前に、まず顔の位置を決める
  • 顔を取り出してぼかしを入れ、処理した顔をビデオフレームに戻します(ビデオ処理も同様です)

(宿題: 自分以外の人をコーディングするにはどうすればいいですか?)

1.コーディングする前に、まず顔の位置を決める

いつものように、まず環境を設定し、必要なライブラリ(OpenCVとMediaPipe)をインストールします。

 pip install opencv-python pip install mediapipe

MediaPipe ライブラリは、顔のキーポイント検出用のモジュールを提供します。

詳細については、https://google.github.io/mediapipe/solutions/face_mesh.html を参照してください。

もちろん、顔のキーポイント検出用のコードもプロジェクト コードに提供されています。

「facial_landmarks.py」のファイル:

顔キーポイント検出の効果図

コードのこの部分を一緒に書いてみましょう:

  • まず、顔のキーポイント検出に必要なライブラリとモジュールをインポートします。
 import cv2 import mediapipe as mp import numpy as np from facial_landmarks import FaceLandmarks # Load face landmarks fl = FaceLandmarks()
  • 次に、検出された顔のキーポイントのうち、キーポイントの最外側の円を使用して、多角形(顔の輪郭)を描画します。ここでは、opencv の convxhull() 関数を使用して次のことを実現できます。
 # 1. Face landmarks detection landmarks = fl.get_facial_landmarks(frame) convexhull = cv2.convexHull(landmarks)

描画後の結果は次のとおりです。

次に、上記で抽出した顔のキーポイント座標を使用してマスクを作成し、ビデオフレーム内の関心領域を抽出します。

 # 2. Face blurrying mask = np.zeros((height, width), np.uint8) # cv2.polylines(mask, [convexhull], True, 255, 3) cv2.fillConvexPoly(mask, convexhull, 255)

結果は以下のようになります。

このマスクを取得した後、顔をさらにぼかす(コード化する)ことができます。

ぼかし操作には、OpenCV の cv2.blur() 関数を使用します。

 # Extract the face frame_copy = cv2.blur(frame_copy, (27, 27)) face_extracted = cv2.bitwise_and(frame_copy, frame_copy, mask=mask)

結果:

現時点では、顔のコーディング操作は実現しています。残っているのは、顔以外の領域を抽出して最終結果に結合することです。

顔の外側の領域(背景)を抽出するには、上記のマスクを反転するだけです。

背景抽出:

 # Extract background background_mask = cv2.bitwise_not(mask) background = cv2.bitwise_and(frame, frame, mask=background_mask)

画像の詳細を見ると、背景は完全に見えていますが、顔の部分が黒くなっていることがわかります。これは、次のステップで顔にぼかしを適用する空白領域です。

最後のステップは、上記の 2 つのステップで取得した顔マスクと背景を追加することです。ここでは、目的を達成するために cv2.add() を使用します。

 # Final result result = cv2.add(background, face_extracted)

結果:

これは画像のフレームの処理です。

2. 顔を取り出してぼかし、処理した顔をビデオフレームに戻します。

上記の操作はすべて、画像の 1 つのフレームに対して処理されます。ビデオを出力する必要がある場合も、原理はまったく同じです。ビデオを一連の画像に分割するだけです。

いくつか小さな変更を加えます:

(1)入力ファイル(画像→動画)

 cap = cv2.VideoCapture("person_walking.mp4")

(2)入力ビデオフレームに対してループトラバーサルを実行する。

 while True: ret, frame = cap.read() frame = cv2.resize(frame, None, fx=0.5, fy=0.5) frame_copy = frame.copy() height, width, _ = frame.shape ...

<<:  AI分野に新たな学者が加わりました!清華大学の胡世民が選出され、「Jitu」フレームワークは彼の研究室から生まれた

>>:  Adobe がインドのスタートアップ Rephrase.ai を買収、生成 AI 分野で初の買収となる

ブログ    
ブログ    

推薦する

...

米国の自動車所有者調査:自動運転車に楽観的な自動車所有者が増えている

一般の人々は自動運転車についてどう思っているのだろうか?市場調査会社CarGurusは最近、将来の自...

...

...

...

MetaHuman の効果は素晴らしいです!しかし、メタバースだけを考えると、パターンは少し小さくなります。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

RSA-PSSアルゴリズムを一緒に学びましょう

[[400577]] AS(5): RSA-PSSアルゴリズムの紹介2018 年にリリースされた T...

...

...

...

4Kウィンドウの長さで長いテキストを読むことができ、陳丹奇の弟子がMetaと提携して、大規模なモデルでメモリを強化する新しい方法を立ち上げました

ウィンドウの長さが 4k でも、大きなモデルで大きなテキストを読み取ることができます。プリンストン大...

現在世界で最も重要な古典的アルゴリズムトップ10

今日の世界では、数え切れないほどの古典的なアルゴリズムが発見または作成されてきました。最も価値あるア...

ディープラーニングを活用してネットワークセキュリティを実現する方法

[[240276]]著者: ゲストブログ翻訳:張玲校正:丁南雅この論文では、ディープラーニングとそれ...

基礎知識がない人でも機械学習に切り替えることは可能ですか?

基礎知識がない人でも機械学習に切り替えることは可能ですか?機械学習には一定の数学的基礎が必要であり、...