5 分間の技術講演 | 顔認識についてどれくらい知っていますか?

5 分間の技術講演 | 顔認識についてどれくらい知っていますか?

パート01 顔認識技術の概要

顔認識技術は生体認証技術の一種で、人物の顔の特定の特徴(目、鼻、口、眉毛など)に基づいて人物を自動的に識別する技術です。顔認識、肖像認識、容姿認識、顔認識などとも呼ばれます。主にカメラやビデオカメラを使用して顔を含む画像やビデオストリームを収集し、顔検出技術を使用して顔があるかどうかを分析します。顔がある場合は、顔の位置、サイズ、主要な顔器官の位置に関する情報を提供します。次に、この情報に含まれる識別特徴を抽出し、既知の顔の特徴と比較して、各顔の識別を行います。


写真

パート02 顔検出

顔検出は、顔認識および顔分析システムの最初の重要なステップです。主に「顔はどこにあるのか」という問題を解決し、画像内の顔の位置とサイズを正確に調整し、その後の顔の特徴分析と認識に提供します。初期の顔検出作業は、主に手動で設計されたローカル記述子に基づく特徴抽出に基づいており、知識ベースの顔検出方法、モデルベースの顔検出方法、特徴ベースの顔検出方法、外観ベースの顔検出方法の 4 つのカテゴリに分けられます。その中でも、より古典的な作業には、Haar カスケード分類器と HOG (Histogram of Oriented Gridients) 特徴検出アルゴリズムがあります。しかし、従来の検出では、複数の変動要因がある難しい画像に対する顔検出の精度が限られています。


写真

図 WIDER FACE: 顔検出ベンチマーク

ディープラーニングの活発な発展に伴い、主にカスケード CNN モデル、R-CNN モデル、シングルショット検出器モデル、特徴ピラミッドネットワークモデル、Transformers モデルなどに基づく、さまざまなディープラーニングアーキテクチャに基づく多くの顔検出方法が徐々に進化し、特徴抽出、精度、スケーラビリティの面で従来の顔検出と認識が大幅に向上しました。 MTCNN は、優れた顔検出モデルの 1 つです。このモデルは、3 段階の深層畳み込みネットワークを通じて、顔とランドマークの位置を大まかから細かく予測します。具体的な手順は次のとおりです。ステージ 1: 浅い CNN を通じて候補ウィンドウをすばやく生成します。ステージ 2: より複雑な CNN を通じて多数の顔以外のウィンドウを拒否することでウィンドウを絞り込みます。ステージ 3: より強力な CNN を使用して結果を再度絞り込み、5 つの顔のランドマークの位置を出力します。

パート03 顔の特徴

顔の特徴は、顔の表現とも呼ばれ、顔の長さ、顔の幅、唇の幅、鼻の長さなど、顔の特定の特徴です。顔の特徴抽出は、顔の特徴をモデル化してベクトル化された顔の特徴を取得するプロセスです。顔の特徴抽出は、その技術的特徴によって、大域情報に基づく全体論的手法、局所情報に基づく局所的特徴手法、ディープラーニングに基づく手法の 3 つに大別できます。ディープラーニングに基づく顔の特徴は、データセットから特徴を自動的に学習できます。データセットが十分に堅牢なデータ(照明、姿勢、表情など)をカバーできる場合、アルゴリズムはさまざまな課題に適応できます。これは、現在主流の顔の特徴抽出方法でもあります。


写真

パート04 顔認識

顔認識は顔を比較するプロセスです。2 つの顔の類似性は、抽出された顔の特徴を比較することによって得られます。判断方法は、2 つの特徴間のユークリッド距離 (L2 距離) またはコサイン距離 (コサイン距離) を比較することです。L2 距離が小さいほど類似性が高くなります。コサイン距離の角度が小さいほど、コサイン距離が大きいほど類似性が高くなります。アライメント数に応じて、1:1 と 1:N に分けられます。最も一般的な 1:1 シナリオは、高速鉄道に乗るときに遭遇する機器などの人物と文書のマッチングです。 1:N は、1 つの顔をデータベース内の N 個の顔と比較することを意味します。たとえば、出勤管理マシンの場合、顔データベースには会社全体の顔写真がすべて含まれています。

<<:  5分間の技術講演 | GPU仮想化に関する簡単な講演

>>:  2時間で人間を超えることができます! DeepMind の最新 AI が 26 の Atari ゲームをスピードラン

ブログ    
ブログ    

推薦する

EasyDLが新しくアップグレードされ、ERNIEの3つの機能によりエンタープライズレベルのNLPモデルを迅速にカスタマイズできるようになりました。

最近、百度文心は3つの主要機能をリリースし、カスタマイズされたマルチラベルテキスト分類、感情傾向分析...

行動バイオメトリクスと機械学習が顧客関係を改善する方法

行動バイオメトリクスは、トラブルのない認証を実現し、世界中の消費者の体験に革命をもたらす画期的なテク...

2024 年の 6 つの主要なテクノロジー トレンドを見据えて、最もホットなテクノロジーをご紹介します。

物事の誕生は突然かつ急速です。変化せずに動くものはなく、移行せずに動くものもありません。技術革新のス...

AIモデリングはもはや困難ではない:Jiuzhang Yunji DataCanvasが2つのオープンソース成果をリリース

[51CTO.comより] 「ソフトウェアインフラは大幅なアップグレードを受け、AIの実装はソフトウ...

...

...

人工知能のための 6 つの無料オープンソース ツール! 3 分で機械学習を始めましょう!

オープンソースでは、自分のアイデアがいかに独創的であったとしても、他の誰かがすでにそのコンセプトを実...

「バンカーズアルゴリズム」の秘密が明らかに!フロントエンド テーブルでカスタム数式を使用して「偶数に丸める」

銀行の収益モデルとは何でしょうか? 3 つの言葉: 情報の非対称性です。銀行は預金者から資金を集めて...

清華大学唐傑チーム: NLP事前トレーニングモデルの歴史の簡単な紹介

[[422829]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

ハードウェアクラッキングに耐えられるハッシュアルゴリズムにはどのようなものがありますか?

序文ブルートフォース クラッキング ツール hashcat を使用したことがある人なら誰でも、このソ...

...

...

アルゴリズムモデルの自動ハイパーパラメータ最適化手法

ハイパーパラメータとは何ですか?学習モデルには、一般的に 2 種類のパラメータがあります。1 つはデ...

世界初、AIによる豚のクローン作成に成功!南開大学がやった

超AI制御により、機械が自動的に人間の胚のクローンを作成し、培養用の栄養プールに送り込み、人間のバッ...