[51CTO.com からのオリジナル記事]最近、私たちの画面には、「どの有名人に一番似ているか?」「将来の自分の姿を予測して?」「年齢差を見て?」など、顔の比較に基づいた写真が頻繁に溢れています... 図[1] 図[1]に示すように、これは「どの有名人に最も似ていますか?」アプリによって作成された比較写真です。この比較プロセスを見ると、その背後にどのような技術が使用されているのかが気になります。最初に思い浮かぶのは、顔認識と美しさです。しかし、詳細は...以下は、質問に回答し、疑問を解決するために専門家が示した正しい姿勢です。興味のある人のために! 顔認識技術の基本的なプロセス 現在、顔認識技術の詳細は無数にあり、工学技術も多様ですが、基本的なプロセスは定式化されています。人物の写真を入力すると、顔検出技術を使用して顔の位置を見つけ、これに基づいて目や口などのキーポイントを見つけ、次にいくつかの幾何学的および光学的補正を実行して顔の特徴を抽出し、顔認識を実現します。 各社の違いは、数点から100点近くまで及ぶキー抽出の数と、各リンクの詳細の追求にあります。 「あなたはどの有名人に一番似ていますか?」この画像(図1~図2)は顔検出技術を使用しています。いくつかのアルゴリズムに基づいて顔の位置を特定して抽出し、少数のキーポイントの検出技術も使用しています。このプロセスでは、さまざまな年齢の人々の写真や顔画像をどのように識別するかが研究する価値のあるポイントです。 年齢不変の顔認識は、学術界では年齢不変の顔認識 (AIFR) として知られています。AIFR テクノロジーは、同じ対象および年齢層の顔画像を認識できます。 AIFR技術は年齢変化に関係なく使用される 顔の特徴は年齢とともに変化する 人の顔の特徴は年齢とともに大きく変化します。グラフィックスの観点から見ると、この変更は輪郭の変更とテクスチャの変更に分けられます。 輪郭の変化とは、顔の特徴や顔の形の空間的な位置や構造的特徴の変化を指します。たとえば、赤ちゃんの顔は一般的に丸みを帯びた滑らかな輪郭をしていますが、大人になると楕円形、四角形、メロンシード型など、より多様な顔の形に成長し、顔の特徴がより立体的になります。 テクスチャーの変化とは、人間の顔の表面の肌の質感の変化を指します。赤ちゃんの肌は丸く、繊細で滑らかですが、大人の肌はより粗く、しわが多い傾向があります。 こうした輪郭や質感の変化は、人間が正確に理解することが難しい場合がよくあります。現在、人工知能技術の発展により、AIFR技術は徐々に成熟してきました。 AIFR技術の2つの主要モデル 現在、AIFRには多くの技術的な方向性がありますが、一般的には生成モデルと識別モデルの2つのタイプに分けられます。 生成モデル 生成モデルの基本的な考え方は、加齢による人間の顔の変化が特定のルールに従うと仮定し、数学的手法を使用して変化のルール自体を解くことです。パターンを理解した後、アルゴリズムは特定の年齢の顔の特徴に基づいて他の年齢の顔の特徴を生成できます。 図[1]を例にとると、具体的な実装手順は次のようになります。
判別モデル 判別モデルは生成モデルとは異なります。判別モデルは、人間の顔の変化するパターンの問題を解決しようとはしません。判別モデルは、顔の特徴の一部は年齢とともに変化しないと仮定し、年齢に依存しないこれらの特徴を使用して顔のアイデンティティを決定します。 図[2] 図[2]は、ディープラーニング技術を使用して年齢以外の特徴を抽出する方法を示しています。 最初の列は、同じ人物の異なる年齢S1、S2、S3の写真です。 畳み込みニューラルネットワークを通じて、システムは固定された特徴の顔の組み合わせS'を使用して元の画像を表す。 例えば: 固有面の組み合わせが隠れ因子アナライザーに入ると、この固有面に最も近い組み合わせのみが選択されます。 例えば: 3列目の顔の類似性はすでに非常に高いことがわかります。 顔認識の時代が到来:顔認識技術の代表的な用途 前述の小規模なアプリケーションに加えて、顔認識はますます広く使用されています。あらゆる分野で、顧客体験を向上させ、サービス レベルを最適化するために顔認識を使用しようとしています。ただし、顔 ID 認識と顔 ID 認証という 2 つの主要なカテゴリにまとめることができます。 表面的には両者は似ているように見えますが、技術的な原理は異なります。顔認識は人々の集団の中であなたが誰であるかを識別するものであり、顔認証はあなたがあなた自身であるかどうかを確認するものです。代表的な用途は次のとおりです。 顔認識
顔認証
これらは本人認証の補助手段です。これまでは、どのようなアプリケーション シナリオであっても、本人認証には ID カードと本人を手動で比較する方法と、ID カードのみを認証する方法の 2 つの方法しかありませんでした。ID カードのなりすましや他人の ID カードの盗難などの問題が発生しやすかったです。顔認識はこれらの問題をうまく解決します。
顔認識はリモートで顔の本人認証を実行できますが、写真詐欺を防ぐために、通常は生体検出ステップが追加されます。
顔認識には依然としてセキュリティ上のリスクがある 顔認識は万能ではありません。技術の背後には依然としてリスクと抜け穴があります。たとえば、シミュレーションヘッドギア、ホログラフィック投影、顔追跡などが継続的に登場しており、単一の顔認識技術には大きな制限があり、セキュリティ要因は技術コンポーネントに比例していません。 したがって、プライバシーや支払いなどに関わる高度なセキュリティのシナリオで使用する場合は、顔認識技術のみを使用するのではなく、顔と声紋、指紋、虹彩などの生体認証信号を必ず統合してください。これにより、セキュリティ要素が大幅に向上します。 参考文献: [1]Park U、Tong Y、Jain A K. 年齢に依存しない顔認識[J]。IEEEパターン分析および機械知能に関する取引、2010、32(5):947-954。 [2] Wen Y、Li Z、Qiao Y. 潜在因子誘導畳み込みニューラルネットワークによるフォーレージ不変の顔認識[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016: 4893-4901.
李吉 CloudIn のプロダクト マネージャー オーストラリアのウーロンゴン大学でコンピュータサイエンスの修士号を取得。Computer World、Changhe Netcomなどの企業でプロダクトマネージャーやオペレーションマネージャーとして勤務し、8年間の製品経験を持つ。現在は北京雲英伝説技術有限公司でビッグデータプロダクトマネージャーとして勤務。彼は、ディープラーニングとマシンビジョンの分野で中国の公安とサイバースペース管理局に関連するいくつかのプロジェクトを主導しており、人工知能技術を通じて社会にさらなる価値を生み出したいと考えています。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
>>: TensorFlow を使用したコンテキスト チャットボットの実装
最近の調査によると、企業は生成 AI がリアルタイムのデータ分析を実現する大きな可能性を秘めていると...
[[438690]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
10月17日午前、百度世界2023大会に、百度創業者のロビン・リー氏が白いシャツを着て落ち着い...
編集者注: この記事はNetEase Intelligenceからのものです。翻訳|: NetEas...
[[411040]]畳み込みニューラル ネットワーク (CNN) は、その強力な畳み込み機能とプーリ...
今日のいわゆるスマート ビルディングの多くは、実際にはビルディング オートメーション システムに加え...
[[407658]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
米国道路交通安全局(NHTSA)は、SAEレベル2の先進運転支援システム(ADAS)またはSAEレベ...
[[353150]]人工知能は、人間のように知覚、認識、決定、実行できる人工プログラムまたはシステム...
「この写真をフォトショップで加工しましょう!」 「いいですよ、でもこの段落は検閲しないと面倒なことに...
転職すると3ヶ月貧乏になるが、転職すると3年間貧乏になるという諺があるようです。科学的な根拠はありま...
ChatGPT の人気が高まるにつれ、生成型人工知能 (GenAI) がテクノロジー業界の未来を大き...
[[386200]] [51CTO.com クイック翻訳] 事実によれば、ロボティックプロセスオー...
[[412066]]現在、全国的に気温が上昇し続けているため、私の国では電力消費のピークの新たな波...