顔認識はどれくらい強力ですか? AIFRテクノロジーはあなたを数分で「スター」に変えます

顔認識はどれくらい強力ですか? AIFRテクノロジーはあなたを数分で「スター」に変えます

[[195170]]

[51CTO.com からのオリジナル記事]最近、私たちの画面には、「どの有名人に一番似ているか?」「将来の自分の姿を予測して?」「年齢差を見て?」など、顔の比較に基づいた写真が頻繁に溢れています...

図[1]

図[1]に示すように、これは「どの有名人に最も似ていますか?」アプリによって作成された比較写真です。この比較プロセスを見ると、その背後にどのような技術が使用されているのかが気になります。最初に思い浮かぶのは、顔認識と美しさです。しかし、詳細は...以下は、質問に回答し、疑問を解決するために専門家が示した正しい姿勢です。興味のある人のために!

顔認識技術の基本的なプロセス

現在、顔認識技術の詳細は無数にあり、工学技術も多様ですが、基本的なプロセスは定式化されています。人物の写真を入力すると、顔検出技術を使用して顔の位置を見つけ、これに基づいて目や口などのキーポイントを見つけ、次にいくつかの幾何学的および光学的補正を実行して顔の特徴を抽出し、顔認識を実現します。

各社の違いは、数点から100点近くまで及ぶキー抽出の数と、各リンクの詳細の追求にあります。

「あなたはどの有名人に一番似ていますか?」この画像(図1~図2)は顔検出技術を使用しています。いくつかのアルゴリズムに基づいて顔の位置を特定して抽出し、少数のキーポイントの検出技術も使用しています。このプロセスでは、さまざまな年齢の人々の写真や顔画像をどのように識別するかが研究する価値のあるポイントです。

年齢不変の顔認識は、学術界では年齢不変の顔認識 (AIFR) として知られています。AIFR テクノロジーは、同じ対象および年齢層の顔画像を認識できます。

AIFR技術は年齢変化に関係なく使用される

顔の特徴は年齢とともに変化する

人の顔の特徴は年齢とともに大きく変化します。グラフィックスの観点から見ると、この変更は輪郭の変更とテクスチャの変更に分けられます。

輪郭の変化とは、顔の特徴や顔の形の空間的な位置や構造的特徴の変化を指します。たとえば、赤ちゃんの顔は一般的に丸みを帯びた滑らかな輪郭をしていますが、大人になると楕円形、四角形、メロンシード型など、より多様な顔の形に成長し、顔の特徴がより立体的になります。

テクスチャーの変化とは、人間の顔の表面の肌の質感の変化を指します。赤ちゃんの肌は丸く、繊細で滑らかですが、大人の肌はより粗く、しわが多い傾向があります。

こうした輪郭や質感の変化は、人間が正確に理解することが難しい場合がよくあります。現在、人工知能技術の発展により、AIFR技術は徐々に成熟してきました。

AIFR技術の2つの主要モデル

現在、AIFRには多くの技術的な方向性がありますが、一般的には生成モデルと識別モデルの2つのタイプに分けられます。

生成モデル

生成モデルの基本的な考え方は、加齢による人間の顔の変化が特定のルールに従うと仮定し、数学的手法を使用して変化のルール自体を解くことです。パターンを理解した後、アルゴリズムは特定の年齢の顔の特徴に基づいて他の年齢の顔の特徴を生成できます。

図[1]を例にとると、具体的な実装手順は次のようになります。

  • 顔の輪郭特徴Sとテクスチャ特徴Tをそれぞれ抽出する
  • キャリブレーションと平均化
  • 顔の特徴の数学的モデルを確立し、モデルパラメータを解いて生成モデルを取得する
  • 予測する人物の顔の特徴を入力します
  • 生成モデルを使用して、この人物の別の年齢の顔の特徴を予測する
  • 輪郭特徴とテクスチャ特徴を再統合する
  • 実際の未来の顔と比較することで、同一人物なのか類似人物なのかを知ることができます。

判別モデル

判別モデルは生成モデルとは異なります。判別モデルは、人間の顔の変化するパターンの問題を解決しようとはしません。判別モデルは、顔の特徴の一部は年齢とともに変化しないと仮定し、年齢に依存しないこれらの特徴を使用して顔のアイデンティティを決定します。

図[2]

図[2]は、ディープラーニング技術を使用して年齢以外の特徴を抽出する方法を示しています。

最初の列は、同じ人物の異なる年齢S1、S2、S3の写真です。

畳み込みニューラルネットワークを通じて、システムは固定された特徴の顔の組み合わせS'を使用して元の画像を表す。

例えば:

固有面の組み合わせが隠れ因子アナライザーに入ると、この固有面に最も近い組み合わせのみが選択されます。

例えば:

3列目の顔の類似性はすでに非常に高いことがわかります。

顔認識の時代が到来:顔認識技術の代表的な用途

前述の小規模なアプリケーションに加えて、顔認識はますます広く使用されています。あらゆる分野で、顧客体験を向上させ、サービス レベルを最適化するために顔認識を使用しようとしています。ただし、顔 ID 認識と顔 ID 認証という 2 つの主要なカテゴリにまとめることができます

表面的には両者は似ているように見えますが、技術的な原理は異なります。顔認識は人々の集団の中であなたが誰であるかを識別するものであり、顔認証はあなたがあなた自身であるかどうかを確認するものです。代表的な用途は次のとおりです。

顔認識

  • VIP顔認識。このアプリケーションは、群衆の中にいる VIP 顧客を自動的にキャプチャして識別し、音声で挨拶したり、バックエンドを通じて関係するスタッフに通知したりすることもできます。
  • フェイスブラックリスト。このアプリケーションは、主要なチャネルに顔のブラックリストを設定し、主要な容疑者などを自動的に識別し、発見されると自動的に警察に通報することができます。

顔認証

  • 金融業界。この分野には、顔スキャンログイン、リモート顔アカウント開設、セルフサービスの顔カード開設など、多くのアプリケーションがあります。顔認識を大規模に適用した最初の銀行は、中国民生銀行です。同銀行は2014年初頭に顔認識プラットフォームの導入を開始し、ビジネスホール、セルフサービス機器、カウンターシステム、モバイルマーケティングに顔認識を適用しました。

これらは本人認証の補助手段です。これまでは、どのようなアプリケーション シナリオであっても、本人認証には ID カードと本人を手動で比較する方法と、ID カードのみを認証する方法の 2 つの方法しかありませんでした。ID カードのなりすましや他人の ID カードの盗難などの問題が発生しやすかったです。顔認識はこれらの問題をうまく解決します。

  • 社会保障業界。代表的な例としては、遠隔資格認証が挙げられます。従来は、被保険者の生活状況を証明するために、職員が現場で資格認証を行う必要がありましたが、高齢であったり、移動が困難であったり、自宅から遠く離れて住んでいる被保険者にとっては特に不便なものでした。

顔認識はリモートで顔の本人認証を実行できますが、写真詐欺を防ぐために、通常は生体検出ステップが追加されます。

  • 教育業界。主に大学入試、成人試験、人事試験などにおいて、指紋認証や顔認証などの生体認証技術を使用して受験者の本人確認を行うことで、本人と証明書の整合性を確保し、試験の公平性を確保することができます。

顔認識には依然としてセキュリティ上のリスクがある

顔認識は万能ではありません。技術の背後には依然としてリスクと抜け穴があります。たとえば、シミュレーションヘッドギア、ホログラフィック投影、顔追跡などが継続的に登場しており、単一の顔認識技術には大きな制限があり、セキュリティ要因は技術コンポーネントに比例していません。

したがって、プライバシーや支払いなどに関わる高度なセキュリティのシナリオで使用する場合は、顔認識技術のみを使用するのではなく、顔と声紋、指紋、虹彩などの生体認証信号を必ず統合してください。これにより、セキュリティ要素が大幅に向上します。

参考文献:

[1]Park U、Tong Y、Jain A K. 年齢に依存しない顔認識[J]。IEEEパターン分析および機械知能に関する取引、2010、32(5):947-954。

[2] Wen Y、Li Z、Qiao Y. 潜在因子誘導畳み込みニューラルネットワークによるフォーレージ不変の顔認識[C]//Proceedings of the IEEE Con​​ference on Computer Vision and Pattern Recognition. 2016: 4893-4901.

[[195175]]

李吉

CloudIn のプロダクト マネージャー

オーストラリアのウーロンゴン大学でコンピュータサイエンスの修士号を取得。Computer World、Changhe Netcomなどの企業でプロダクトマネージャーやオペレーションマネージャーとして勤務し、8年間の製品経験を持つ。現在は北京雲英伝説技術有限公司でビッグデータプロダクトマネージャーとして勤務。彼は、ディープラーニングとマシンビジョンの分野で中国の公安とサイバースペース管理局に関連するいくつかのプロジェクトを主導しており、人工知能技術を通じて社会にさらなる価値を生み出したいと考えています。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  人工知能時代の倫理的枠組み

>>:  TensorFlow を使用したコンテキスト チャットボットの実装

ブログ    

推薦する

レポート | ジェネレーティブ AI はリアルタイムの可能性を秘めているが、まだ初期段階にある

最近の調査によると、企業は生成 AI がリアルタイムのデータ分析を実現する大きな可能性を秘めていると...

Google は NLP モデルのデバッグを許可しており、必要なのは「ドラフト ペーパー」だけです。

[[438690]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

Baidu は革命を起こしました!

10月17日午前、百度世界2023大会に、百度創業者のロビン・リー氏が白いシ​​ャツを着て落ち着い...

インターネットの未来のために: AI が生み出すものと破壊するもの

編集者注: この記事はNetEase Intelligenceからのものです。翻訳|: NetEas...

CVサークル対決:GoogleがViTGANを提案、GANをトレーニングするためにビジュアルトランスフォーマーを使用

[[411040]]畳み込みニューラル ネットワーク (CNN) は、その強力な畳み込み機能とプーリ...

スマートビルディングでは通信システムに何が必要ですか?

今日のいわゆるスマート ビルディングの多くは、実際にはビルディング オートメーション システムに加え...

毛沢東選集と魯迅全集をAIに与えたところ、AIが書いた大学入試のエッセイは非常に適切だった。

[[407658]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

米国NHTSAの新規制:レベル2以上の自動運転に関わる事故は報告が必要

米国道路交通安全局(NHTSA)は、SAEレベル2の先進運転支援システム(ADAS)またはSAEレベ...

AI + スマート交通が全体のアップグレードと調整を実現

[[353150]]人工知能は、人間のように知覚、認識、決定、実行できる人工プログラムまたはシステム...

Github が絶賛: モザイクテキスト = 無意味、AI があなたの思考をすべて見抜く、オープンソースに

「この写真をフォトショップで加工しましょう!」 「いいですよ、でもこの段落は検閲しないと面倒なことに...

あるプログラマーは仕事を辞めて人工知能に転職した。4か月後に後悔し、多くの挫折を経験した。

転職すると3ヶ月貧乏になるが、転職すると3年間貧乏になるという諺があるようです。科学的な根拠はありま...

...

生成型人工知能(GenAI)は将来のテクノロジーの展望を一変させる

ChatGPT の人気が高まるにつれ、生成型人工知能 (GenAI) がテクノロジー業界の未来を大き...

企業は今後の組織開発においてハイパーオートメーションを採用するでしょうか?

[[386200]] [51CTO.com クイック翻訳] 事実によれば、ロボティックプロセスオー...

ドローンは電力網を守り、点検や障害物の除去も可能!

[[412066]]現在、全国的に気温が上昇し続けているため、私の国では電力消費のピークの新たな波...