パート01 顔認識技術の概要顔認識技術は生体認証技術の一種で、人物の顔の特定の特徴(目、鼻、口、眉毛など)に基づいて人物を自動的に識別する技術です。顔認識、肖像認識、容姿認識、顔認識などとも呼ばれます。主にカメラやビデオカメラを使用して顔を含む画像やビデオストリームを収集し、顔検出技術を使用して顔があるかどうかを分析します。顔がある場合は、顔の位置、サイズ、主要な顔器官の位置に関する情報を提供します。次に、この情報に含まれる識別特徴を抽出し、既知の顔の特徴と比較して、各顔の識別を行います。 写真 パート02 顔検出顔検出は、顔認識および顔分析システムの最初の重要なステップです。主に「顔はどこにあるのか」という問題を解決し、画像内の顔の位置とサイズを正確に調整し、その後の顔の特徴分析と認識に提供します。初期の顔検出作業は、主に手動で設計されたローカル記述子に基づく特徴抽出に基づいており、知識ベースの顔検出方法、モデルベースの顔検出方法、特徴ベースの顔検出方法、外観ベースの顔検出方法の 4 つのカテゴリに分けられます。その中でも、より古典的な作業には、Haar カスケード分類器と HOG (Histogram of Oriented Gridients) 特徴検出アルゴリズムがあります。しかし、従来の検出では、複数の変動要因がある難しい画像に対する顔検出の精度が限られています。 写真 図 WIDER FACE: 顔検出ベンチマーク ディープラーニングの活発な発展に伴い、主にカスケード CNN モデル、R-CNN モデル、シングルショット検出器モデル、特徴ピラミッドネットワークモデル、Transformers モデルなどに基づく、さまざまなディープラーニングアーキテクチャに基づく多くの顔検出方法が徐々に進化し、特徴抽出、精度、スケーラビリティの面で従来の顔検出と認識が大幅に向上しました。 MTCNN は、優れた顔検出モデルの 1 つです。このモデルは、3 段階の深層畳み込みネットワークを通じて、顔とランドマークの位置を大まかから細かく予測します。具体的な手順は次のとおりです。ステージ 1: 浅い CNN を通じて候補ウィンドウをすばやく生成します。ステージ 2: より複雑な CNN を通じて多数の顔以外のウィンドウを拒否することでウィンドウを絞り込みます。ステージ 3: より強力な CNN を使用して結果を再度絞り込み、5 つの顔のランドマークの位置を出力します。 パート03 顔の特徴顔の特徴は、顔の表現とも呼ばれ、顔の長さ、顔の幅、唇の幅、鼻の長さなど、顔の特定の特徴です。顔の特徴抽出は、顔の特徴をモデル化してベクトル化された顔の特徴を取得するプロセスです。顔の特徴抽出は、その技術的特徴によって、大域情報に基づく全体論的手法、局所情報に基づく局所的特徴手法、ディープラーニングに基づく手法の 3 つに大別できます。ディープラーニングに基づく顔の特徴は、データセットから特徴を自動的に学習できます。データセットが十分に堅牢なデータ(照明、姿勢、表情など)をカバーできる場合、アルゴリズムはさまざまな課題に適応できます。これは、現在主流の顔の特徴抽出方法でもあります。 写真 パート04 顔認識顔認識は顔を比較するプロセスです。2 つの顔の類似性は、抽出された顔の特徴を比較することによって得られます。判断方法は、2 つの特徴間のユークリッド距離 (L2 距離) またはコサイン距離 (コサイン距離) を比較することです。L2 距離が小さいほど類似性が高くなります。コサイン距離の角度が小さいほど、コサイン距離が大きいほど類似性が高くなります。アライメント数に応じて、1:1 と 1:N に分けられます。最も一般的な 1:1 シナリオは、高速鉄道に乗るときに遭遇する機器などの人物と文書のマッチングです。 1:N は、1 つの顔をデータベース内の N 個の顔と比較することを意味します。たとえば、出勤管理マシンの場合、顔データベースには会社全体の顔写真がすべて含まれています。 |
<<: 5分間の技術講演 | GPU仮想化に関する簡単な講演
>>: 2時間で人間を超えることができます! DeepMind の最新 AI が 26 の Atari ゲームをスピードラン
午後は、かわいい子供たちを連れて映画「頭の大きい息子と頭の小さいお父さん 完璧なお父さん」を見に行き...
生成モデルとシーケンス モデルは、常に私を魅了してきました。これらのモデルは、機械学習を初めて学ぶと...
製造業において、インダストリー 4.0 は単なる流行語ではなく、新たな現実となっています。新型コロナ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
海外メディアは、プライスウォーターハウスクーパースの報告書が、人工知能と5G技術が今後3~5年でスマ...
ビッグデータダイジェスト制作出典: piprogramming編纂者:清寧人工知能は私たちの生活の一...
下の図は、人間にとって非常に区別しやすい 3 種類の動物、鳥、犬、馬を示しています。しかし、人工知能...
AlphaGoが数年前にプロの囲碁プレイヤーに勝利して以来、人工知能はメディアで最もよく使われる言...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
最近、マイクロソフトは最新の Azure ニューラル ネットワーク音声合成技術 Uni-TTSv3 ...
人工知能の活発な発展は大きな論争を引き起こしています。発展の一般的な傾向からすると、これはデメリット...