リアルタイムで「顔」をぼかす！実践的なチュートリアル

みなさんこんにちは。今日は実践的なチュートリアルを皆さんと共有したいと思います。

いつものように、まずは結果を見てみましょう（目標があることを確認してください）。

顔認識技術の発達により、私たちの日常生活は大きく便利になりましたが、プライバシーの問題もあります。そして、犯罪者が違法行為を行うために利用される可能性もあります。

そのため、多くのビデオブロガーは通行人の画像をぼかします。しかし、手動でコーディングするのは非常に面倒な作業です。1 フレームの画像であれば比較的簡単ですが、ビデオのフレームレートが 25FPS、つまり 1 秒間に 25 フレームの画像があると仮定すると、数分間のビデオの場合、作業量も非常に膨大になります。

そこで、プログラムを使って、このような操作を自動で実行してみます！

Opencv、Mediapipe、Python を使用して、顔をリアルタイムでぼかすことができます。

これは 2 つのステップで実行できます。

コーディングする前に、まず顔の位置を決める
顔を取り出してぼかしを入れ、処理した顔をビデオフレームに戻します（ビデオ処理も同様です）

(宿題: 自分以外の人をコーディングするにはどうすればいいですか?)

1.コーディングする前に、まず顔の位置を決める

いつものように、まず環境を設定し、必要なライブラリ（OpenCVとMediaPipe）をインストールします。

 pip install opencv-python pip install mediapipe

MediaPipe ライブラリは、顔のキーポイント検出用のモジュールを提供します。

詳細については、https://google.github.io/mediapipe/solutions/face_mesh.html を参照してください。

もちろん、顔のキーポイント検出用のコードもプロジェクトコードに提供されています。

「facial_landmarks.py」のファイル:

顔キーポイント検出の効果図

コードのこの部分を一緒に書いてみましょう:

まず、顔のキーポイント検出に必要なライブラリとモジュールをインポートします。

 import cv2 import mediapipe as mp import numpy as np from facial_landmarks import FaceLandmarks # Load face landmarks fl = FaceLandmarks()

次に、検出された顔のキーポイントのうち、キーポイントの最外側の円を使用して、多角形（顔の輪郭）を描画します。ここでは、opencv の convxhull() 関数を使用して次のことを実現できます。

 # 1. Face landmarks detection landmarks = fl.get_facial_landmarks(frame) convexhull = cv2.convexHull(landmarks)

描画後の結果は次のとおりです。

次に、上記で抽出した顔のキーポイント座標を使用してマスクを作成し、ビデオフレーム内の関心領域を抽出します。

 # 2. Face blurrying mask = np.zeros((height, width), np.uint8) # cv2.polylines(mask, [convexhull], True, 255, 3) cv2.fillConvexPoly(mask, convexhull, 255)

結果は以下のようになります。

このマスクを取得した後、顔をさらにぼかす（コード化する）ことができます。

ぼかし操作には、OpenCV の cv2.blur() 関数を使用します。

 # Extract the face frame_copy = cv2.blur(frame_copy, (27, 27)) face_extracted = cv2.bitwise_and(frame_copy, frame_copy, mask=mask)

結果：

現時点では、顔のコーディング操作は実現しています。残っているのは、顔以外の領域を抽出して最終結果に結合することです。

顔の外側の領域（背景）を抽出するには、上記のマスクを反転するだけです。

背景抽出:

 # Extract background background_mask = cv2.bitwise_not(mask) background = cv2.bitwise_and(frame, frame, mask=background_mask)

画像の詳細を見ると、背景は完全に見えていますが、顔の部分が黒くなっていることがわかります。これは、次のステップで顔にぼかしを適用する空白領域です。

最後のステップは、上記の 2 つのステップで取得した顔マスクと背景を追加することです。ここでは、目的を達成するために cv2.add() を使用します。

 # Final result result = cv2.add(background, face_extracted)

結果：

これは画像のフレームの処理です。

2. 顔を取り出してぼかし、処理した顔をビデオフレームに戻します。

上記の操作はすべて、画像の 1 つのフレームに対して処理されます。ビデオを出力する必要がある場合も、原理はまったく同じです。ビデオを一連の画像に分割するだけです。

いくつか小さな変更を加えます:

（１）入力ファイル（画像→動画）

 cap = cv2.VideoCapture("person_walking.mp4")

（２）入力ビデオフレームに対してループトラバーサルを実行する。

 while True: ret, frame = cap.read() frame = cv2.resize(frame, None, fx=0.5, fy=0.5) frame_copy = frame.copy() height, width, _ = frame.shape ...

<<: AI分野に新たな学者が加わりました！清華大学の胡世民が選出され、「Jitu」フレームワークは彼の研究室から生まれた

>>: Adobe がインドのスタートアップ Rephrase.ai を買収、生成 AI 分野で初の買収となる

GPT-4Vと人間のデモンストレーションによるロボットのトレーニング：目が学習し、手がそれに従う

ブログ

ナレッジグラフの紹介と応用

ブログ

ユーザーはChatGPTが怠惰になったと不満を述べ、OpenAIはモデルを調整しておらず原因を調査中であると回答した。

ブログ

原理から応用まで: ロジスティック回帰アルゴリズムの簡単な説明

ブログ

シンプルなデータ暗号化と復号化アルゴリズムの実装方法を教えます

ブログ

Pythonでゲームボーイエミュレーターを作成し、AIモデルをトレーニングする:デンマーク人の大学のプロジェクトが大ヒット

ブログ

リアルタイムで「顔」をぼかす！実践的なチュートリアル

1.コーディングする前に、まず顔の位置を決める

2. 顔を取り出してぼかし、処理した顔をビデオフレームに戻します。

GPT-4Vと人間のデモンストレーションによるロボットのトレーニング：目が学習し、手がそれに従う

ナレッジグラフの紹介と応用

ユーザーはChatGPTが怠惰になったと不満を述べ、OpenAIはモデルを調整しておらず原因を調査中であると回答した。

原理から応用まで: ロジスティック回帰アルゴリズムの簡単な説明

シンプルなデータ暗号化と復号化アルゴリズムの実装方法を教えます

Pythonでゲームボーイエミュレーターを作成し、AIモデルをトレーニングする:デンマーク人の大学のプロジェクトが大ヒット

推薦する

ByteDanceは、従来の4倍の速度を誇る高性能トレーニングおよび推論エンジンLightSeqを発表した。

テスラが自社開発したスーパーコンピュータDojo！日本の「富岳」に代わる世界初の

孫玄: Zhuanzhuan が AI エンジニアリングアーキテクチャシステムを構築する方法

物理学者は神の粒子を研究するためのアルゴリズムを開発するためにプログラマーを招待する

人工知能の時代に、人間の知能は不可欠なのでしょうか?

ロボットに粘土をこねることを教える？ MIT、IBM、UCSDなどが共同でソフトウェア運用データセットを公開

Xing Bo 氏のチームの LLM360 は、大規模なモデルを真に透明化する総合的なオープンソースプロジェクトです。

人工知能（AI）について知っておくべきことすべて

4つの基本的なソートアルゴリズムのPHPコード実装

7つの変革的技術トレンド：第4次産業革命をリードする

心が開かれました！ Adobeなどの研究者が「自撮り」を「他人が撮った写真」に変え、感動的な魔法の写真編集効果を実現

Daguan Data: ナレッジグラフと Neo4j の簡単な分析