アバターにマスクとゴーグルを追加する プロジェクトアドレス: https://github.com/Evilran/add-mask-and-goggle 序文 2020年の新型コロナウイルス肺炎が武漢で発生し、感染防止のため誰もがマスクを着用した。友達の輪も例外ではありません。多くのユーザーがアバターにマスクを付けていますが、写真の中でマスクの位置を調整するのに多くの時間がかかります。では、顔認識によってアバターにマスクやゴーグルを自動的に追加するにはどうすればよいでしょうか? このプロジェクトは、顔認識技術を使ってアバターにマスクやゴーグルを自動的に追加し、皆さんにマスクやゴーグルを積極的に着用して、武漢と最前線で戦う医療従事者を応援するよう呼びかけるものです! 依存関係 🐍 始める前に、python3 に次のパッケージをインストールする必要があります。
Flask はプロジェクト用のシンプルな Web サーバーを提供し、dlib は顔と唇と目 (マスクの位置を提供) を認識するために使用され、opencv ライブラリは顔の唇にマスク マテリアルを追加し、顔の目にゴーグルを追加できます。 Webサーバーを構築する まず、Flask ライブラリをインポートしてメイン ページを構築します。
当社のサーバーでは画像ファイルのアップロードのみが許可され、画像はキャッシュされないことに注意してください (ユーザーは他のマスクを選択して再作成できます)。そのため、次のように設定する必要があります。
当社の Web サーバーには 2 つのルートが含まれています。
url は貼り付けられた画像のアドレスで、サーバーは自動的に画像をダウンロードします。add はユーザーが手動で画像をアップロードするためのものです (ユーザーが手動で画像をアップロードする必要がある場合は、requests ライブラリを導入する必要はありません)。 ルート追加機能のコードは次のとおりです。
次に、テンプレート内の index.html ファイルを設定します。詳細なコードについては、Github プロジェクトに移動してください。 顔認識 これで、Web サーバーの設定は完了です。次に、画像を処理するためのバックエンド コードの作成を始めましょう。 dlib および opencv ライブラリをインポートします。
トレーニング済みの Dlib 前方顔検出器 detector = dlib.get_frontal_face_detector() を使用して顔を検出し、'models/shapepredictor68facelandmarks.dat' を使用して口の 20 個の特徴点 (40 次元の特徴) の座標を抽出します。
同じ方法で、顔の目の特徴を抽出します。
唇と目の位置を特定した後、OpenCV を使用して透明な背景マスクとゴーグルのマテリアルを処理し、背景を白に変換します。
次に、画像の融合を実行し、取得した唇と目の位置にマスクとゴーグルを追加します。
この時点で、顔認識にマスクとゴーグルを追加するコードが正常に完了しました。 デモ 😷 プロジェクトが完了したら、 Web サーバーを実行するのは、1 つのコマンドと同じくらい簡単です。
次に、127.0.0.1:5000 (ポート 5000) にアクセスします。 ここでサポートされているモードは 2 つあります。1 つは URL アドレスを入力するモード、もう 1 つは画像を直接アップロードするモードです。 現在、マスクは次のタイプをサポートしています。 例えば: 元の画像: マスクとゴーグルを追加します。 元の画像: マスクを追加します: ありがとう🙏 最前線で戦ってくださっている医療従事者の方々に感謝、そして春節の旅行ラッシュで逆風の中頑張ってくださっている方々に感謝! |
<<: AIのための大規模ストレージインフラストラクチャの要件
>>: 適切な AI データ ストレージを選択するための 6 つのガイドライン
最近、障害を乗り越えるヒューマノイドロボットのビデオが話題になった。ビデオでは、ヒューマノイドロボッ...
モノのインターネット (IoT) センサーは主に運用スタックの可視性を提供し、リアルタイムで正確な運...
下の図は、人間にとって非常に区別しやすい 3 種類の動物、鳥、犬、馬を示しています。しかし、人工知能...
この記事では、ディープラーニングを使用して NBA の試合結果を予測します。この記事を通じて、次のこ...
今日、私たちの AI は何ができるでしょうか? AI による描画、AI による作曲、AI による動画...
最近、劉強東氏は、今後10年間でJD.comの従業員数を現在の16万人から8万人に減らし、1人当たり...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
私は知乎でこの質問を見ました: 自動運転車は10年後には当たり前になるでしょうか?そして、今でも運転...
[[441692]]トランスフォーマーは本当に多用途です。トランスフォーマーは、もともと自然言語処...
少し前、ビリビリのトップUP司会者「こんにちは先生、私の名前は何童雪です」が「Airdesk」を開発...
[[441550]] Connect 2021カンファレンスで、ザッカーバーグ氏はFacebook...
大規模モデルの時代では、視覚言語モデル (VLM) のパラメータは数百億、さらには数千億にまで拡大し...
大規模な多国籍産業企業は、進行中のデジタル産業革命で効果的に競争できるように、機械をよりスマートにす...
人工知能と機械学習の技術は世界に革命をもたらし、世界をより先進的なものにしていますが、この 2 つの...