顔認識はどのようにして顔を認識するのでしょうか?

顔認識はどのようにして顔を認識するのでしょうか?

顔をスキャンして出勤記録を取ったり、顔で支払いをしたり、顔でドアを開けたり、顔をスキャンしながら生活を始めていませんか?

指紋、虹彩、音声、静脈、網膜認証と比較すると、顔認証はより高速で便利です。顔認証技術がどのように実現されているかご存知ですか?

2D画像データに基づく顔認識は現在主流であり、セキュリティ、監視、アクセス制御、出席、金融ID認証、エンターテイメントなど、多くのシナリオで使用されています。その利点は、比較的多くのアルゴリズムが実装されており、プロセスが比較的成熟していることです。画像データの取得も比較的簡単で、通常のカメラのみが必要です。

2D 顔認識の主な原理は、写真のマッチング、つまり収集した顔写真をシステム ライブラリに保存されている顔と比較してマッチング結果を得ることです。

(顔検出-顔の位置合わせ-顔の表現-顔のマッチング)

実際には、収集された写真は、光源、顔の角度、モーションブラーなどの要因の影響を受けることがよくあります。そのため、2D アライメントの場合、顔画像上の顔の特徴点の座標を正確に見つけることが重要です。従来のアプローチは、手動で設計された機能と、幾何学的手法、全体論的手法、機能ベースの手法、ハイブリッド手法などの機械学習技術に基づいています。その後、大規模なデータセットでトレーニングされたディープニューラルネットワーク (DNN) と畳み込みニューラルネットワーク (CNN) に基づくディープラーニング手法が登場しました。現在、2D顔認識技術はかなり成熟しており、2D顔認識アルゴリズムの認識精度は99.80%に達し、人間の認識精度に匹敵します。

2D顔認識は精度が高いですが、偽顔詐欺を防ぐのは困難です。現在、当社の一般的な不正防止方法には、アルゴリズム支援、ビデオ支援、音声支援が含まれます。特に銀行の認証プロセスでは、顔は唯一の認証次元ではありません。顔認識の後、携帯電話番号、IDカードなどを検証する必要があります。これは、2D顔認識は使いやすいものの、完全に安全で信頼できるわけではないことを示しています。

2D顔認識には一定の限界があるため、その欠点を補うために3D顔認識技術が誕生しました。

2D顔認証と比較して、3D顔認証ではより安全なデータ読み取り機器を使用して顔の真正性を保証し、顔情報の盗難を困難にします。開発期間を経て、データサンプルが増えるにつれて、3D 顔認識のアルゴリズムはますます成熟してきました。

3D 顔認識の利点は、主に画像取得技術にあります。主な 3D カメラ技術には、3D 構造化光、TOF、両眼立体視などがあります。

3D構造光

3D 構造化光は、特定の構造特性を持つ光を赤外線光プロジェクターを通して撮影対象物に投影し、専用の赤外線カメラで撮影することで実現されます。光学三角測量測定の原理に基づいて計算を実行し、画像上の各点の奥行き情報を取得し、最終的に3次元データを取得します。したがって、どんな平面写真も 3D 構造化光の目から逃れることはできません。

3D構造化光による顔認証は、一部のスマートフォンで実用化されています。例えば、iPhoneで採用されているFace IDは、ハードウェアとアルゴリズムを組み合わせて、3D顔認証で携帯電話やアカウントを認証します。

東経

TOF は飛行時間 (time of fly) の略で、レーザー測距のことです。光源は一般に方形波パルスで変調され、パルスの発信と受信の時間差に基づいて距離が測定されます。

TOF テクノロジーは、従来の 2D XY 軸画像に Z 軸方向からの深度情報を追加し、最終的に 3D 画像情報を生成します。 TOF の主な用途は、機械とのインタラクティブ デバイスです。ゲームで使用され、主に人間の姿勢データを取得して処理します。

TOF は長距離でのデータ収集に適しているため、一部のメーカーは携帯電話の背面カメラに TOF 設計を追加しています。

両眼立体視

両眼視は視差の原理に基づいた方法で、複数の画像から物体の3次元の幾何学的情報を取得します。測定対象物の2つのデジタル画像をデュアルカメラで異なる角度から同時に取得し、視差の原理に基づいて対象物の3次元幾何情報を復元することで、画像上の各点の奥行き情報を取得し、最終的に3次元データを取得します。

上図は、ヘッドアップ両眼ステレオ撮影の原理を示す簡単な概略図です。2 台のカメラの投影中心間の距離がベースライン距離 B です。 2 台のカメラが同時に時空間オブジェクトの同じ特徴点 P を観測し、それぞれ「左目」と「右目」の P の座標に基づいて、カメラ座標系における P の 3 次元座標を計算します。したがって、左カメラの画像平面上の任意の点が右カメラの画像平面上の対応するマッチング点を見つけることができれば、その点の 3 次元座標を完全に決定できます。

3D顔認識システムは精度が高く盗難防止に有効ですが、3Dカメラや双眼カメラなどの専用機器が必要です。現在、3D顔認識コンポーネントが普及していないため、2D顔認識は依然として市場シェアが最も高いですが、今後は減少傾向にあります。

セキュリティ分野では、3D顔認識が徐々に注目を集めています。 2019年のCPSEセキュリティ博覧会で、Dahua LeChengは業界初の3D構造化光AI顔認識ビデオロックを発表しました。これはユーザーのためにミリメートルレベルの3D顔モデルを構築し、写真、ビデオ、フードやマスクによる攻撃を効果的に防ぐことができます。さらに、3D構造化光認識は、光や背景光環境などの要因の影響を受けにくく、その応用はより安定しています。

市場では、3D顔認識モジュールの価格が高止まりしており、スマートロックのコストが上昇しています。また、中国の家庭におけるスマートロックの需要が十分に活用されていないため、3D顔認識機能を備えたスマートロックの市場シェアは比較的低いです。しかし、近い将来、この新しい技術に対する人々の受け入れはますます高まり、3D顔認識技術の人気もますます高まると私たちは信じています。

<<:  人工知能:しっかりと根を張ってこそ、どこでも繁栄できる

>>:  企業は今後の組織開発においてハイパーオートメーションを採用するでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

人工知能はユーザーのメッセージング体験を変える

Emogi は、チャット アプリでテキストを送信したり、投稿にコメントしたり、友人にビデオを送信した...

マスク氏に敵対的買収の疑い!ツイッター株を受け取ったが取締役会には参加せず、訴訟を起こされている

これはすべて悪意のある計画ですか? ツイッター株を7000万株以上購入した後、マスク氏は取締役会への...

ユニバーサルミッション!清華大学、線形複雑性を実現するバックボーンネットワークFlowformerを提案|ICML2022

タスクの一般性は、基本モデル研究の中心的な目標の 1 つであり、ディープラーニング研究が高度なインテ...

エネルギー効率を向上させるために、脳は予測知覚能力を発達させた。

[[436377]]この記事はLeiphone.comから転載したものです。転載する場合は、Lei...

...

2019年には疑似AIはすべて排除されるのでしょうか?

2017年以降、ディープラーニングの概念が再び浮上し、AIは世界で最もホットな産業となりました。起...

「人工知能のゴッドファーザー」ジェフリー・ヒントン氏は再び警告した。AIが人間に取って代わるかもしれない

10月10日、「人工知能のゴッドファーザー」として知られるジェフリー・ヒントン氏は、人工知能は危険で...

...

...

四川大学の優秀な卒業生がGitHubでプロジェクトを構築し、完成前に多くの賞賛を受けた。

近年、ディープラーニングは音声、画像、自然言語処理などの分野で非常に優れた成果を上げており、当然なが...

WEF: 2023 年のトップ 10 新興テクノロジー

世界経済フォーラム(WEF)は毎年、世界経済と社会に大きな影響を与える可能性のあるトップイノベーショ...

AIプロジェクトが失敗する6つの理由

人工知能が人間の生活と市場に与える影響は計り知れません。世界経済統計によると、人工知能は2030年ま...

...