顔認識のためのディープラーニングとオブジェクト検出のステップバイステップガイド

顔認識のためのディープラーニングとオブジェクト検出のステップバイステップガイド

これまでの共有を通じて、顔認識の一般的なプロセスを理解しました。主に次のプロセスが含まれます。

1. 顔画像（生データ）の収集

2. 画像から顔を認識する

3. 顔データの抽出

4. 顔データの保存

5. 画像や動画から顔を検出する

6. 顔データの抽出

7. 認識された顔をデータベース内のデータと一つずつ比較し、顔を識別する。

上記の顔認識プロセスには、いくつかの問題があります。元の顔データが比較的大きい場合、データベースには大量の顔データが存在する必要があります。顔認識を実行するときに、認識された顔をデータベースのデータと比較する際に必然的に多くの時間がかかり、リアルタイムの顔認識の速度に大きな影響を与えます。 CNN 畳み込みニューラルネットワークにヒントを得て、ニューラルネットワークを使用して顔データをトレーニングします。ラベルは顔の名前、データは顔データです。ニューラルネットワークを使用して顔データをトレーニングします。データが大きいほど、ニューラルネットワークの認識速度と精度が高くなり、顔認識の速度と精度が大幅に向上します。顔認識プロセスは次のようになります。

1. 顔画像（生データ）の収集

2. 画像から顔を認識する

3. 顔データの抽出と保存

4. 顔データと顔ラベルのニューラルネットワークトレーニングとトレーニングモデルの保存

5. 画像や動画から顔を検出する

6. 識別された顔はニューラルネットワークによって予測され、顔認識が実行される。

この号では顔データの抽出について紹介します

1. オリジナル顔画像の収集

顔認識を行うには、ユーザーの顔画像を収集する必要があります。この記事では、ウェブサイトから数人の有名人の写真を収集して共有します。

まず、ディレクトリファイルの下に新しいデータセットフォルダーを作成し、その中に複数のフォルダーを配置します。各フォルダーには有名人の写真が含まれています。フォルダー名は有名人の名前です。ディレクトリは次のようになります。

2.顔検出モデルと顔抽出・埋め込みデータモデルを設定する

顔検出モデルでは、Caffe でトレーニングされたResNet-10 および SSD アルゴリズムを直接使用します。

顔データ抽出埋め込みモデルは、OpenFace の openface_nn4.small2.v1.t7 モデルを使用します。このモデルは pytorch でトレーニングされており、opencv を使用して直接読み込むことができます。

顔検出モデルと顔抽出・埋め込みデータモデル

3. 画像アドレスを初期化し、顔データ配列と顔名ラベル配列を初期化する

顔データを初期化する

4.データセットディレクトリ全体を走査し、画像を処理する

30 行目では、後で保存する必要があるラベル値であるフォルダーの名前を抽出します。

33 行目から 35 行目では、画像を読み取ってサイズを変更します。

38行目は画像のブロブ値を計算します

43-44行目: 画像のブロブ値を顔検出ニューラルネットワークに入力して顔検出を行う

47 行目: 画像内で顔が検出されると、ニューラルネットワークの len 値は 0 より大きくなります。

50行目、顔が検出されると、顔の信頼度を抽出します。

53行目は顔の信頼度を0.5に設定する。

55行目から59行目は、画像内の顔の位置を計算し、顔のサイズを抽出します。

61-62行目、顔のサイズが小さい場合、顔の情報を無視し、画像内の大きい方の顔を選択します。

64行目、顔画像のサイズが要件を満たしている場合、顔のブロブ値を計算します。

67-68行目は顔画像のブロブ値を顔埋め込みデータニューラルネットワークに渡します。

71-72行目は顔ラベルと顔データを配列に保存します。

5. 顔データを保存する

トラバーサルが完了すると、データセット内のすべての顔データが事前に作成された配列に保存されます。

77 行目では、新しい辞書データを作成し、顔ラベルと顔データをローカルに保存して、後でニューラルネットワークをトレーニングできるようにします。

以上の5つのステップで顔全体のデータ収集が完了します。もちろん、後の段階でより高い顔認識精度を求める場合は、大量の顔データを収集する必要があります。

この記事のこの部分は、顔認識の最初の部分、つまり顔データの収集と抽出です。後ほど、顔認識システムのニューラルネットワークのトレーニングと顔認識について説明します。

<<: アルゴリズム | 再帰の深い理解、あなたは再帰を誤解しています

>>: 時速55キロ！寧波杭州湾新区のスマート道路に無人車が走行

大量のニューロンを必要とせず、ニューロモルフィックロボットはスピードと正確さでテーブルサッカーをプレイします

大量のニューロンを必要とせず、ニューロモルフィックロボットはスピードと正確さでテーブルサッカーをプレイします

ブログ

ブログ

メタ、マイクロソフトなどの大手企業は、AIモデルの訓練に海賊版書籍を使用したとして、数人のアメリカ人作家から訴えられた。

メタ、マイクロソフトなどの大手企業は、AIモデルの訓練に海賊版書籍を使用したとして、数人のアメリカ人作家から訴えられた。

ブログ

貪欲アルゴリズムについて質問するのはやめてください。

貪欲アルゴリズムについて質問するのはやめてください。

ブログ

ブログ

700 を超えるチームが登録し、「ICV アルゴリズム研究タスクの第 1 バッチ」の登録フェーズが成功裏に終了しました。

700 を超えるチームが登録し、「ICV アルゴリズム研究タスクの第 1 バッチ」の登録フェーズが成功裏に終了しました。

ブログ

なぜ私はLangChainを諦めたのでしょうか?

なぜ私はLangChainを諦めたのでしょうか?

ブログ

AIGCの投資刺激策のおかげで、マイクロソフトとグーグルのクラウドコンピューティング事業は大幅に成長した

AIGCの投資刺激策のおかげで、マイクロソフトとグーグルのクラウドコンピューティング事業は大幅に成長した

ブログ

AES暗号化アルゴリズムの強度が弱まった

AES暗号化アルゴリズムの強度が弱まった

ブログ

人工知能やその他の科学研究には「越えてはならない一線」があり、5つの原則が倫理的な最低ラインを示している

人工知能やその他の科学研究には「越えてはならない一線」があり、5つの原則が倫理的な最低ラインを示している

ブログ

推薦する

知遠の「盗作スキャンダル」最新報道：盗作2件、不正引用4件、関係者全員が自主辞任

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載...

...

人工知能は「教育革命」を起こしている

人工知能は教育分野に大きな波を起こしている。この傾向は、北京師範大学とiFLYTEKが共催した「人工...

...

AIによる売上予測により、組織は不確実性の中でコントロールを獲得できる

AI を活用した販売は、新型コロナウイルス感染症のパンデミックによってもたらされた不確実性に多くの組...

人工知能：創薬の厳しい時代に革命を起こすもの

業界の専門家は、人工知能（AI）の強力なサポートにより、医薬品の研究開発分野は大きな変化の波に見舞わ...

ADAPT: エンドツーエンドの自動運転の説明可能性を徹底的に探求する、理解の夜明け!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

モバイルアプリの開発とビジネスにおける人工知能の役割は何ですか?

人工知能の誕生により、モバイルアプリケーションに大きな可能性をもたらすまったく新しい時代が到来しま...

...

産業オペレーションの深化が人工知能コンピューティングセンター構築の鍵

新たな科学技術革命と産業革命の到来とともに、デジタル経済は第四次産業革命の重要な礎となり、新たな組織...

機械学習でサプライチェーンを改善する10の方法

現在、企業は機械学習を使用することで、予測エラー率、需要計画の生産性、コスト削減、納期厳守において ...

さまざまな業界の技術専門家の皆様にアンケートにご参加いただき、Yiou Industryの年間会員カードを受け取り、多数の業界レポートのロックを解除していただくよう心からお願い申し上げます。

iResearch は、さまざまな業界におけるクラウドコンピューティング、人工知能、ビッグモデ...

企業はデータセンターで人工知能を広く利用する準備ができているでしょうか?

今日、ますます多くのサーバーベンダーが、人工知能を活用したサーバー自動化テクノロジーの開発に取り組ん...

「公平性」、人工知能はこれを達成できるのか？

2020年の東京オリンピックはこれまで以上に盛り上がっています。 7月28日に行われた男子体操個人...