2020年顔認識レポート:数万社が市場に参入し、8つの主要技術と6つのトレンドがすべて1つの記事でカバーされています

2020年顔認識レポート:数万社が市場に参入し、8つの主要技術と6つのトレンドがすべて1つの記事でカバーされています

[[379936]]

近年、人工知能、コンピュータービジョン、ビッグデータ、クラウドコンピューティング、チップなどの技術の急速な発展に伴い、顔認識技術は大きな進歩を遂げ、多くの場面でうまく応用され、広く商品化され、経済社会の発展と人々の日常生活に利便性をもたらしています。

市場発展の動向から見ると、顔認識の応用シナリオはさまざまな業界シナリオに浸透しているものの、市場規模の成長傾向は分散しており、国内市場ではアルゴリズム競争からチップ産業チェーン全体に至るまで熾烈な競争状態が見られます。技術発展の面では、エッジSOCチップの計算能力の向上により、顔認識システムのアルゴリズムの一部またはすべてがエッジデバイス上で実行できるようになり、クラウドエッジ統合が顔認識製品およびアプリケーションソリューションの発展トレンドとなっています。

1. 顔認識とは何ですか?
顔認識は、顔の特徴に基づいて人を識別する生体認証技術です。 近年、人工知能、コンピュータービジョン、ビッグデータ、クラウドコンピューティング、チップなどの技術の急速な発展に伴い、顔認識技術は大きな進歩を遂げ、多くのシナリオにうまく応用されてきました。

広義の顔認識には、顔のビューの取得、顔の位置決め、顔認識の前処理、本人確認、本人検索など、顔認識システムを構築するための一連の関連技術が含まれます。一方、狭義の顔認識は、顔による本人確認または本人検索のための技術とシステムを指します。 さらに、一部のアプリケーション シナリオでは、品質評価や活性検出などのアルゴリズム モジュールも必要になる場合があります。

顔認識には主に 3 つのアプリケーション モードがあります。

(1)顔認証:2つの顔画像が同一人物のものかどうかを判定します。身分証明書の照合など、本人認証によく使用されます。

(2)顔識別:顔画像が与えられた場合、それが登録データベースに存在するかどうかを判断します。存在する場合は、特定の識別情報を返します。静的検索または動的制御によく使用されます。

(3)顔クラスタリング:顔画像のバッチが与えられた場合、同じ人物の画像は同じクラスに分類され、異なる人物の画像は異なるクラスに分類されます。一般的なアプリケーションには、スマートフォトアルバムや1人1ファイルなどがあります。

1. 開発の経緯<br /> 顔認識の研究は1960年代に始まり、1990年代に主要な応用段階に入りましたが、主に学術研究と小規模な実験室環境での応用にとどまっていました。顔認識技術が歴史的な進歩を遂げ、真に大規模な商用化を実現したのは、2012年以降のディープラーニングの復活によってでした。その認識能力は、従来の人間の認識能力をはるかに超えています。

現在、世界の顔認識技術分野における応用シナリオの配置の観点から見ると、セキュリティ、金融、交通、建築などは比較的成熟した分野であり、小売、広告、スマートデバイス、教育、医療、エンターテインメントなどの分野でも多くの応用シナリオがあり、経済社会の発展と人々の日常生活の利便性に新たな機会をもたらしています。

2. 政策状況 人工知能技術の急速な発展とビッグデータの応用による経済発展の着実な進展に伴い、顔認識技術はスマートシティやセキュリティ市場などの業界で広く利用されるようになりました。同時に、顔認識技術の応用プロセスに関わる規制問題もますます高い課題に直面しています。顔認識技術の急速な発展に直面して、わが国はより健全な発展を促進するための一連の政策を策定しました。

2017年7月、国務院は「次世代人工知能発展計画」(国発[2017]第35号)を公布し、行政管理、司法管理、都市管理、環境保護など社会統治におけるホットで困難な問題に焦点を当て、人工知能技術の応用を促進し、社会統治の近代化を推進し、安全で便利なインテリジェント社会の構築を指摘した。同時に、総合的な社会統治、新たな犯罪捜査、テロ対策などの緊急のニーズに焦点を当て、映像情報分析・認識技術や生体認証技術をベースにしたインテリジェントなセキュリティ・警察製品の開発、インテリジェント監視プラットフォームの構築を提案します。

2018年に全国人民代表大会で改正された「中華人民共和国反テロ法」第50条には、公安機関はテロ活動の疑いのある行為を捜査する場合、関連法律や規則に従って容疑者を尋問、検査、召喚することができ、肖像、指紋、虹彩画像などの人体生体情報や血液、尿、剥離細胞などの生体サンプルを抽出または収集し、署名を保管することができると規定されている。

中国人民銀行は2019年9月、「金融技術(フィンテック)発展計画(2019~2021年)」(以下、「計画」)を発表し、インターネット時代に適応したモバイル端末向けの信頼できる環境を構築し、信頼できるコンピューティング、安全なマルチパーティコンピューティング、暗号化アルゴリズム、生体認証などの情報技術を最大限に活用し、安全性と利便性の両方を考慮した多様化された身分認証システムを確立・改善し、金融取引の検証方法を継続的に充実させ、モバイルインターネット環境における金融取引の安全性を確保し、金融サービスの可用性、満足度、セキュリティレベルを向上させることを明確に提案しました。

同時に、「計画」では、需要リーダーシップの役割を強化し、デジタル経済環境下での市場需要の急速な変化に積極的に適応し、顧客情報のセキュリティを確保することを前提に、ビッグデータ、モノのインターネットなどの技術を使用して顧客の金融ニーズを分析することも提案されています。機械学習、生体認証、自然言語処理などの新世代人工知能技術の助けを借りて、金融マルチメディアデータの処理と理解能力を向上させ、「テキストを読む」と「言語を理解する」ことができるインテリジェントな金融製品とサービスを作成し、顔認識の安全な応用のアイデアも提供しています。

2019年9月、工業情報化部は「サイバーセキュリティ産業の発展促進に関する指導意見」(意見募集草案)について意見を公募し、商用暗号化、指紋認証、顔認証などの技術に基づくネットワークID認証システムの構築への支持を表明し、ネットワークセキュリティ管理のサポート能力と組織的高強度攻撃への対応力の向上に重点を置き、サイバーセキュリティ産業の発展における生体認証技術の重要性を明確にした。

2020年11月初旬、「中華人民共和国国民経済と社会発展第14次5カ年計画要綱(草案)」(以下、「草案」という)全文が発表され、新世代情報技術、バイオテクノロジーなどの産業の発展を加速し、インターネット、ビッグデータ、人工知能などの産業の深い融合を推進し、新技術、新製品、新業態、新モデルを育成することが明確に提案された。

デジタル経済を発展させ、デジタル社会とデジタル政府の構築を強化し、公共サービス、社会統治などのデジタルインテリジェンスのレベルを向上させます。 同時に、発展と安全を調整し、より高いレベルでより安全な中国を築き、社会安全予防管理システムの構築を強化することが提案された。この計画の導入により、今後 5 年間の顔認識技術と業界の発展の目標と方向性が設定されます。

情報セキュリティのレベルでは、2016年11月に全国人民代表大会で可決されたサイバーセキュリティ法により、個人の生体認証情報の管理がさらに改善され、その範囲が明確化されました。 中国サイバースペース管理局の関係当局者は、サイバーセキュリティ法の公布と施行は一般大衆の重要な利益を保護するだけでなく、ハイテクの応用にも役立ち、インターネットの巨大な潜在力を刺激するだろうと述べた。

2020年7月に全国人民代表大会で公布された「データセキュリティ法案」草案は、データに「保護シールド」を追加し、データ活動のレッドラインを明確にし、将来的には「データ主権、データ管理、データ取引」などの分野での法的規定を通じて、データ時代の急速な発展を促進するだろう。 国は、データの安全性と発展の確保を同等に重視するという原則を堅持し、データ安全保護技術の研究開発を奨励し、データ資源の開発と利用を積極的に推進し、法律に従ってデータの秩序ある自由な流れを確保します。

2020年10月21日に全国人民代表大会で公布された「個人情報保護法(草案)」では、個人情報とは、電子的方法またはその他の方法で記録された、識別された、または識別可能な自然人に関する各種情報であると規定されており、個人情報の収集、保管、使用、処理、送信、提供、開示など、個人情報の処理に関する要件が規定されています。

2. 技術的な詳細
1. 顔認識技術の原理<br /> 現在主流の顔認識アルゴリズムには、主に顔検出、顔の前処理、特徴抽出、比較と認識、生体識別の 5 つのステップが含まれます。 このうち、顔検出、顔前処理、特徴抽出は、総称して顔ビュー分析プロセスと呼ばれ、ビデオや画像から顔を検出し、画質判断によって適切な顔写真を選択し、その後の比較と認識のために顔特徴ベクトルを抽出します。比較と認識処理は、顔検証(1:1)と顔認識(1:N)の2つのカテゴリに分けられます。生体識別アルゴリズムは、顔認識処理における顔画像が実際の人体から収集されたものであるかどうかを判断するために使用されます。

実際の応用においては、上記の顔認識アルゴリズムに加えて、フロントエンドビュー取得技術、顔データ保存技術、アプリケーションソフトウェア管理技術も、顔認識技術の応用における重要な技術部分です。

2. 顔認識に関する研究機関の紹介<br /> 顔認識は最も人気のある生体認証技術であり、国内外の多くの研究機関、大学、企業などの機関が顔認識関連技術の研究、開発、応用を行っています。 2020年10月現在、啓察局のデータによると、社名、製品、ブランド、業務範囲が「顔認識」を網羅する企業は全国で10,443社ある。設立時期から見ると、関連企業の数は過去5年間で飛躍的に増加し続けており、2019年には1,955社が設立され、2020年10月までだけで1,139社が新たに追加された。

科学研究機関。顔認識技術は、学術研究機関や産業界の研究機関から幅広い注目を集めています。 世界には、顔認識の分野で技術研究を行っている有名な学術機関が数多くあります。代表的な顔認識技術研究機関としては、スタンフォード大学、カリフォルニア大学バークレー校、マサチューセッツ大学、オックスフォード大学、トロント大学、香港中文大学、中国科学院自動化研究所、清華大学などが挙げられます。

(1)スタンフォード大学。スタンフォード大学は、顔認識技術において画期的な進歩を達成した最初の研究機関の一つです。 中国の科学者、李飛飛教授が率いるコンピュータビジョン研究所は、ImageNetデータベースに基づく毎年恒例の大規模視覚認識チャレンジ(ILSVRC)を通じて、顔認識とコンピュータビジョン技術の発展を大きく促進してきました。

最近、スタンフォード大学の研究チームが顔追跡ソフトウェア「Face2Face」を開発しました。このソフトウェアは、カメラを通じてユーザーの動きや表情を捉え、Face2Faceソフトウェアを使用してビデオ内の対象人物にまったく同じ動きや表情をさせ、非常にリアルな効果を生み出すことができます。 この技術では、高密度の光度測定一貫性測定を使用して、ソース ビデオとターゲット ビデオの顔の表情をリアルタイムで追跡します。

研究者らは、顔の表情を再現できるのは、ソース素材と被写体の間でモーフィングを高速かつ効率的に転送できるためだと述べている。 口の形が話されている内容と密接に一致するため、非常に正確で信憑性のある一致が生まれます。

(2)カリフォルニア大学バークレー校カリフォルニア大学バークレー校は、海外における顔認識技術研究の重要な発祥地であり、2005年には早くも顔認識関連の研究の理論的な作業を行っていました。 中でも、2008年に馬易氏が発表した「顔認識におけるスパース性と堅牢性」は、Google Scholarで6,321回以上引用されている。ディープニューラルネットワークが広く使用される以前は、顔認識アルゴリズムの主流だった。 この記事では、スパース表現理論を顔認識のシナリオに適用し、顔認識のための一般的な分類アルゴリズムを提案します。

この新しいフレームワークは、顔認識分野における特徴抽出と遮蔽に対する堅牢性という 2 つの重要な問題に関して、より優れた理論的ガイダンスを提供します。また、当研究室は最近、低次元モデルによる高次元データの処理や特徴選択の理論分野で一定の成果を上げており、条件付き共分散演算子のトレースを最小化することに基づいて特徴選択を行う新しい特徴選択法(条件付き共分散最小化、CCM)を提案し、比較的優れた成果を上げています。

(3)米国マサチューセッツ大学マサチューセッツ大学は、顔認識技術に関する海外の研究の重要な発祥地でもあります。同大学は、有名な顔検出データベースFDDBと顔認識データセットLFWoをオープンソース化しています。FDDBは、世界で最も権威のある顔検出評価プラットフォームの1つであり、テストセットとして2,845枚の画像と合計5,171人の顔が含まれています。テスト セットには、さまざまなポーズ、解像度、回転、遮蔽の写真のほか、グレースケールとカラーの画像が含まれています。現在までに、FDDB によって公開された評価セットは、顔検出の世界最高レベルを表しています。

マサチューセッツ大学も、制約のない条件下での顔認識アルゴリズムのパフォーマンスを評価するために、2007年に顔認識評価データセットLFWを確立しました。現在までに、これは顔認識の分野で最も広く使用されている評価セットです。 このデータセットは、さまざまな向き、表情、照明環境の自然なインターネットシーンにおける世界中の有名人の顔画像 13,000 枚以上で構成されており、合計 5,000 人以上が対象で、そのうち 1,680 人は 2 枚以上の顔画像を持っています。 各顔画像には、それを区別するための固有の名前 ID とシーケンス番号が付けられています。 LFW テストの精度は、さまざまな人種、照明、角度、遮蔽などの下で顔を認識する顔認識アルゴリズムの総合的な能力を表します。

(4)オックスフォード大学オックスフォード大学のVGG(Visual Geometry)グループ研究所は、影響力のある顔データベースの公開や深層顔認識アルゴリズムの研究など、2015年に顔認識の研究を開始しました。 2015年に当研究室がBMVCで発表した「ディープ顔認識」論文は、Google Scholarで3,600回以上引用されています。その中で発表されたVGG-Faceは、ディープ顔認識の分野で最もよく使用されるデータベースの1つとなっています。

2018年に、大規模顔認識データVGG-Face2がリリースされました。これはVGG-Faceの2番目のバージョンであり、331万枚の画像、9131のID、平均画像数は362.6枚で、幅広い姿勢、年齢、人種をカバーしています。 VGG-Face2 はリリース以来 2 年間で 800 件以上の引用を受けています。 さらに、当研究室では最近、顔認識の信頼性予測やセットベースの顔認識などのサブ分野で毎年一定量の学術成果を生み出しています。

(5)トロント大学カナダのトロント大学は、ディープラーニングベースの顔認識技術の開発を推進する重要な機関の一つです。有名な「ニューラルネットワークの父」であるジェフリー・ヒントンは、この学派の代表的な学者です。ヒントンのリーダーシップの下、トロント大学の研究者はバックプロパゲーションアルゴリズムをニューラルネットワークとディープラーニングに適用しました。このアルゴリズム技術を適用することで、顔認識技術の認識性能が大幅に向上しました。

最近、トロント大学の研究者らは顔認識プライバシー保護技術の分野で新たな進歩を遂げ、顔のプライバシーを保護するための動的干渉アルゴリズムを開発しました。 この技術の原理は「敵対的トレーニング」に基づいています。互いに競合する 2 つのアルゴリズムを確立することにより、検出アルゴリズムが顔の特徴を探していることが判明した場合、干渉アルゴリズムはこれらの特徴を自動的に調整して写真に非常に微妙な干渉を発生させ、検出システム全体の検出効果を妨げます。

(6)香港中文大学香港中文大学の唐暁教授率いるチームは、ディープラーニング技術の研究開発に投資した最も初期の中国チームの一つであり、長年かけて構築された主要技術に基づいて、迅速に技術的ブレークスルーを達成しました。 2012 年の国際コンピュータ ビジョンおよびパターン認識会議 (CVPR) で発表されたディープラーニングに関する 2 つの論文は、どちらも彼の研究室からのものでした。2011 年から 2013 年にかけて、コンピュータ ビジョン分野の 2 大会議である ICCV と CVPR で 14 件のディープラーニング論文が発表され、世界中でこの 2 つの会議で発表されたディープラーニング論文の総数 (29 件) のほぼ半数を占めました。 2009年、コンピュータビジョン分野の二大国際学術会議の一つであるCVPRにおいて最優秀論文賞を受賞。CVPR史上初めてアジアからの論文が同賞を受賞した。

(7)中国科学院オートメーション研究所中国科学院自動化研究所は、中国におけるパターン認識の分野における主要な研究機関です。 長年にわたり、顔認識の分野では広範な研究が行われてきました。 自動化研究所の李子清研究員が率いる顔認識研究チームは、照明の変化の影響に効果的に対処できる近赤外線ベースの顔認識技術を提案し、2008年の北京オリンピックのセキュリティプロジェクトにもこの技術を適用した。

自動化研究所の研究者 Sun Zhenan 氏が率いるチームは、顔認識タスクにおける最も古典的なポーズの不一致問題を克服するために、生成的敵対ネットワークに基づく高忠実度ポーズ不変モデル (HF-PIM) を提案しました。実験結果によると、提案された方法は、視覚効果とベンチマーク データセットの定量的なパフォーマンス指標の両方の点で、現在の最高の GAN ベースの方法よりも優れていることがわかりました。 さらに、HF-PIM でサポートされる生成画像の解像度は、元の方法と比較して 2 倍になりました。

(8)清華大学清華大学は、中国で最も早く顔認識技術の研究に取り組んだ研究機関の一つです。 清華大学の蘇光大教授は1980年代から顔認識技術の研究を行っている。 蘇教授は、1:1画像サンプリング理論と近傍画像並列プロセッサ理論を提唱し、2005年にマルチコンピュータ並列処理技術を通じて顔認識処理の性能を大幅に向上させました。

この技術は、2012 年にトロント大学のヒントン チームが提案したバックプロパゲーション アルゴリズムの計算効率を向上させるために並列コンピューティングを使用する技術に似ています。 同時に、蘇教授のチームは、最適な2次元顔、異なるカテゴリーの多特徴記述、MMP-PCAなど、顔認識のための一連の理論と方法を提案しました。

テクノロジー企業。顔認識技術の研究分野では、多くのテクノロジー企業も重要な役割を果たしてきました。 Microsoft Research Asiaは早くから顔認識技術の研究に着手し、多数の優れた学術論文を発表してきた。2018年にはMicrosoft Research Asiaが提唱するディープラーニング残差ネットワークRESNETが研究分野で広く認知された。Appleは顔認識技術の徹底的な研究を進め、2017年からiPhoneXに顔スキャンによるロック解除機能を導入している。

NEC 株式会社は、世界における顔認識技術の先駆者でもあり、顔認識技術をベースにした公共安全ソリューションを早くから提案してきました。

中国には、センスタイム、メグビー、イトゥ、クラウドウォークといういわゆる「人工知能の四小龍」がおり、顔認識の分野では学術研究から産業実践まで多くの仕事を行い、複雑なシナリオと大規模な処理で継続的に新しい成果を上げています。百度、アリババ、テンセント、平安科技、ハイクビジョン、ダーファなどの伝統的な国内テクノロジー企業も、顔認識技術分野で広範かつ徹底的な研究を行い、本来の事業領域のシナリオと組み合わせて、目覚ましい技術研究成果を上げています。

3. 顔認識技術の利点と限界 技術的な利点。さまざまな生体認証方法の中でも、顔認識技術は独自の特別な利点を持っているため、生体認証において重要な役割を果たします。

(1)非侵入性:顔認識は、人の通常の行動を妨げることなく、より良い認識結果を達成することができます。ユーザーがカメラの前にしばらく留まる限り、ユーザーの身元が正しく認識されます。

(2)利便性:顔認識取得装置はシンプルで素早く使用できます。 一般的に言えば、特に複雑な専用機器を必要とせずに、一般的なカメラを使用して顔画像を撮影することができます。 画像の取得は数秒以内に完了します。

(3)親しみやすさ:顔による本人確認方法は人間の習慣と一致しており、人間も機械も顔画像を使って本人確認を行うことができます。

(4)非接触:顔画像の収集では、ユーザーがデバイスに直接接触する必要はありません。 さらに、顔画像は比較的長い距離から収集できます。 光学ズームレンズを搭載したカメラは、焦点距離を10倍以上に伸ばすことができ、被写界深度を50メートル以上にまで広げ、遠くの景色を鮮明に撮影したり、遠くの顔画像を効果的に撮影したりすることができます。

(5)スケーラビリティ。顔認識後、認識結果データをさらに処理して適用することで、アクセス制御、顔画像検索、出勤時のカードスワイプ、不法人物識別など、多くの実用的なアプリケーションシナリオを拡張できます。

(6)高い隠蔽性。セキュリティ分野ではシステムの隠蔽性が強く求められており、この点では顔認証は指紋認証や他の認証方法よりも多くの利点がある。

(7)強力な事後追跡機能。システムによって記録された顔情報は非常に重要かつ使いやすい手がかりであり、事後追跡アプリケーションに役立ちます。

(8)高精度。人体や歩き方などの他の特徴と比較して、顔の特徴は識別力が強く、誤報率が低い。適用できるデータベースの規模ははるかに大きい。現在、超大規模(十億レベル)の顔検索はすでに実用化されている。

技術的な制限。顔認識技術自体も、類似した顔、年齢、アルゴリズムの偏り、多様なシナリオ、顔画像がより一般に公開されているという事実により、一定の制限に直面しています。

(1)似た面を解くのはより困難である。 双子や非常によく似た人の顔は誤認されやすく、この問題を完全に解決できる新しい技術は現在のところ存在しない。 NISTの分析報告書は、ほとんどの場合、双子のスコアはまだ区別できるが、閾値を超えることが多く、オープンな環境で適用した場合の効果は乏しいと指摘した。

(2)アルゴリズムの偏りの問題 現在の顔認識アルゴリズムはデータサンプルに大きく依存していますが、異なるグループの人々の顔データサンプルには違いがあるため、異なる地域や異なる年齢の人々に対するアルゴリズムの認識能力に違いが生じます。

アメリカ国立標準技術研究所(NIST)の調査によると、顔認識ソフトウェアは地域、人種、性別、年齢によって大きく異なることが分かっています。 例えば、子供や高齢者、その他あまり見られない人種や肌の色の人々の顔認識率は比較的低く、この問題は早急に解決する必要があります。

(3)顔認識率は多くの要因の影響を受けやすい。 既存の顔認識システムは、ユーザーの協力と理想的な取得条件により満足のいく結果を達成できます。 しかし、ユーザーが協力しなかったり、収集条件が理想的でなかったりすると、既存システムの認識率に影響が出てしまいます。 例えば、NIST のテストレポートによると、マスクを着用するとほとんどのアルゴリズムのエラー率が 1 桁以上増加し、年齢や広角などの要因によっても程度はさまざまに低下します。

(4)加齢変化の影響 年齢を重ねるにつれて、特に思春期の若者では顔の見た目が変わります。 顔認識アルゴリズムの認識率は年齢層によって異なります。

(5)セキュリティ上の問題 顔認識システムの情報保存もハッカー攻撃に対して脆弱です。 したがって、データを暗号化することが重要です。 技術が進歩するにつれて、顔認識技術のセキュリティを強化する必要があります。

同時に、人間の顔は他の生体認証データよりも露出度が高く、受動的に収集するのが簡単です。 これは顔情報データが盗まれやすくなることも意味しており、個人のプライバシーを侵害するだけでなく、財産の損失を引き起こす可能性もあります。 大規模なデータベース漏洩は、グループや国にセキュリティ上のリスクをもたらす可能性もあります。

4. 顔認識技術の開発動向<br /> 顔認識技術の幅広い応用に伴い、技術自体の継続的な発展も常に推進されています。 基礎アルゴリズム研究、顔再構成技術、マスクによる顔認識、3D顔認識技術、新しい顔取得技術、顔クラスタリング技術、低品質顔認識技術は、産業界と学界が関心を寄せるホットな話題であり、顔認識技術の発展動向を示しています。

基本的なアルゴリズム技術のホットスポットには、モデル構造設計、損失関数設計、教師なし/半教師あり学習アルゴリズム、分散自己学習アルゴリズムなどがあります。 現在、モデル構造設計には、手動設計とネットワーク構造検索 (NAS) という 2 つの主なアプローチがあります。 ICCV 2019 軽量顔認識コンペティションの結果によると、大規模モデル シナリオでの構造改善による改善は比較的限られているものの、軽量シナリオでのネットワーク構造の改善は認識率の向上に明らかな効果があることがわかりました。

損失関数設計の中核は、十分に識別力があり堅牢な特徴を学習することです。 近年では、メトリック学習やさまざまなマージンベースの手法が徐々に主流になってきています。 特徴抽出の高速化に関しては、軽量ネットワーク、モデル蒸発、スパース量子化などが主な方法であり、特徴比較の高速化に関しては、量子化とさまざまな近似最近傍検索技術が主なアイデアです。

低品質の顔認識技術。実際の動的アプリケーション シナリオでは、シーンの制御できない要因により、顔認識テクノロジで収集された画像の品質は、トレーニング画像の品質とは大きく異なります。たとえば、顔のたわみ、大きな横顔、モーション ブラーと焦点が合っていないブラー、遮蔽物 (マスク、サングラスなど)、低い光強度とコントラスト、ビデオ伝送のエンコードおよびデコード プロセスによって発生する顔情報の損失などです。これらの要因により、精度率が非常に低くなります。

これらの特定の問題に対処するために、研究者は、敵対的な生成ネットワークを使用してディープラーニングベースの方法を使用して、小型のぼやけた顔の超解像度再構築を実行するなど、敵対的な生成ネットワークを使用してカメラのスタイルを転送するなど、さまざまな画像強化と画像生成技術を組み合わせることにより、顔認識アルゴリズムの精度を改善する方法を提案しました。

さらに、3Dフェイス認識技術は、単一モダリティの顔認識の不十分な堅牢性の問題を効果的に解決できます。たとえば、大きな角度、閉塞、特徴融合、決定融合などによって引き起こされる効果の低下が含まれます。

マスク付きの顔認識技術。マスクによる顔の認識は、今年の新しいコロナウイルスの発生中にかなりの注目を集めています。 一般的に使用されるソリューションには、データの強化、閉塞回復、およびマルチコントロール、見知らぬ人の検出、およびマスクのポートレートライブラリを脱ぐことなく接触した通過に適用できます。

フェイスクラスタリングは、個人的な写真コレクション管理とスマートシティガバナンスの両方で広く使用されています。 初期の頃は、主にK-meanなどの従来のクラスタリング方法に基づいていましたが、その効果は良くありませんでした。 近年、GCNベースのフェイスクラスタリング方法が登場しています。 実際のビジネスでは、時空間情報の採掘もホットな研究トピックです。

特定のグループ識別技術。子供/高齢者とさまざまな肌の色の人の顔認識のために、ラベルの付いたデータが少なく、より多くの標識データがあります。 研究者は、パフォーマンスをさらに向上させるために、半教師/監視なしの学習方法を使用できることを提案しました。 同時に、敵対者やドメインの適応などの方法は、研究者がより多くの注意を払う方法でもあります。 特定のグループの特定では、高齢者が顔認識システムを使いやすくする方法を考慮する必要があります。

写真、ビデオ、ヘッドモデル、および顔認識システムでのその他の補綴物の攻撃を防ぐために、プレゼンテーション攻撃検出アルゴリズムは、主な検出原則にも含まれます。

a)離散画像検出方法、つまり、判断のために1つ以上の画像を使用します。

b)連続画像検出方法、つまり、ディスプレイエッジ、フレーム、画面反射、ピクセル、ストライプ分析などの検出など、判断に連続画像シーケンスを使用します。

c)ユーザーは、検出方法に積極的に協力します。つまり、指示を通じて、ユーザーはうなずき、頭の上昇、頭の左側と右折、口の開く、点滅、画面上の迅速な情報の読み取りなどの対応するアクションを完了する必要があります。

d)補助ハードウェア機器に基づく検出方法、つまり、補助ハードウェア機器を使用して、深さカメラを使用して顔の深さ情報を収集したり、特定の波長光源を使用して皮膚または非皮の材料で生成された放出の差を投影して検出したりするなど、判断を支援するためのより多くの判断基盤を取得します。

e)次のようなユーザーパッシブ協力検出方法:静脈、筋肉、骨、および静脈血液におけるデオキシヘモグロビンの吸収特性を使用して、それが特定の指示を介してユーザーの目の動きを導き、それが実際の生体であるかどうかを追跡する。

マルチモーダル融合認識技術。マルチモーダル融合認識技術は、複雑なシナリオでの単一モダリティの顔認識の不十分な堅牢性の問題を効果的に解決できます。 たとえば、マルチモダリティは、大きな角度、閉塞、または低ピクセルのために効果が低下した場合、またはアプリケーションシナリオがセキュリティと信頼性のために高い要件を持っている場合、認識の信頼性を高めることができます。

マルチモーダル認識のための2つの開発の方向性は、この技術の利点に基づいて、肩、肩、身体認識を追加することです。業界で注目を集めています。

3。顔認識業界
1。業界開発の概要<br /> クラウドコンピューティング、ビッグデータ、モノのインターネット、人工知能などのコンピューターサイエンステクノロジーの急速な発展により、実用的なアプリケーションでのフェイス認識技術の継続的な成熟度は、スマートセキュリティ、スマートな都市、スマートホーム、モバイル決済など、および顔認識の新しいアプリケーションシナリオの分野で輝き続けています。

世界の顔認識産業の規模は、まだ非常に高い速度で成長しています。 Marketsandmarketsが発表した世界の顔認識市場に関するレポートによると、世界の顔認識市場規模は2019年の32億米ドルから2024年の79億米ドルに増加すると予想され、予測期間中(2019-2024)の複合年間成長率は16.6%増加しています。

国内では、2018年から2018年にかけて、中国の顔認識技術への投資は、2018年にピークに達しました。 2019年から2020年にかけて、顔認識技術の開発は減速し、合理的な期間に入りました。 オレンジ色のデータ統計によれば、現時点では、中国の顔認識技術への総投資は406億元に達しています。 将来を見据えた産業研究所は、顔認識市場規模が今後5年間で平均複合複合成長率を23%維持し、2024年までに市場規模が100億元を超えると予測しています。

2。業界開発の現在の状況<br /> フェイス認識産業チェーンは、上流にあるデバイス、一般的なハードウェア、および基本的なソフトウェアを使用して、最終的には装備と製品の環境を提供します。

産業チェーンの上流の観点から、国内メーカー(HuaweiとCambrianが代表する)は、チップ製造の観点から強力な能力を持っています。 ただし、ハイエンドチップの製造プロセスと基本的なコンポーネントは、外国によって独占されており、上流メーカーの開発を制限するボトルネックになっています。

顔認識アルゴリズムの観点から見ると、国内のメーカーには利点がありますが、データプライバシーの問題とアルゴリズムのパフォーマンスの公平性の問題は、国内メーカーが緊急に解決する必要がある問題です。

業界チェーンの下流では、顔認識がますます広く使用されており、過度の虐待とユーザープライバシーの盗難の事件さえありました。 ハッカーの攻撃と非ライブ攻撃は、顔認識システムのセキュリティにも課題をもたらします。

基本コンポーネント:

汎用プロセッサ。現在、汎用プロセッサには、主にX86、ARM、およびRISC-Vの3つのシリーズが含まれています。 X86プロセッサは、サーバーに最適なメインプロセッサです。 安定性の理由で、IntelのXeonシリーズが市場を支配しており、AMDはめったに使用されません。アームプロセッサは、携帯電話などのスマートターミナルの最初の選択肢であり、ソフトウェアのエコロジーの改善により、このイニシアチブをサポートするために一連の高性能コアとサーバーのレディー認定も拡大しています。

スマートターミナルで使用される代表的なアームチップには、HisiliconのKirinシリーズ、QualcommのSnapdragonシリーズ、MediatekのMTK、RockchipのRKが含まれます。 RISC Vは、中国のハイテクセクターに関する米国の弾圧により、オープンソースのプロセッサアーキテクチャです。

Pingtou GEによって発売されたHyuntie 910チップは、RISC-Vアーキテクチャを採用しています。 中国の主流の汎用プロセッサには、MISPアーキテクチャを使用するLoongsonと、Alphaアーキテクチャを使用するShenweiも含まれます。 一般に、Hisiliconが代表する国内のチップ設計会社の分野では、主要な問題に等しい地位に到達しています。

AI-Accelerated Soc。 GPUを使用した一般的な並列コンピューティングとは異なり、AI-Accelerated SoCは、人工知能の実装により急速に上昇する専用のチップです。 Nvidiaは最初にGPUの一般的な並列コンピューティングのためのCUDA生態環境を確立し、AIのさらなる開発段階でテンソルコンピューティングとNVDLA加速ユニットを発売し、AI加速の分野での地位をさらに強化しました。 Googleは、Tensorflowと密接に統合されたTPUを起動するためのソフトウェアの利点に依存していますが、Googleの大規模な使用を除いて市場では広く使用されていません。

Hisiliconはまた、AI加速の分野で大きな成果を上げており、Hisi 35xxシリーズチップスとAstengシリーズチップを連続して発売しました。 HISI 35XXシリーズAl Acceleration Chipは、0.5トップから4TOPSまでのコンピューティングパワーを提供でき、安全な都市、輸送、電気、フェイスアクセス制御、車両に搭載されたAIに搭載されたCHIPを提供するAISシリーズのAIアクセラを提供することができます。電力と低電力消費は、データセンターでも使用されています。

中国科学アカデミーのバックグラウンドを持つカンブリア紀は、MLU220およびMLU270チップスがそれぞれ8TOPSと128TOPSコンピューティングを提供する最初のAIチップ会社になりました。 カンブリア紀に加えて、Horizo​​n's Journey、Sun Rising Chip、YituのQiusuoチップなど、SOCを加速するためにAIのトラックに多くのスタートアップが参加しています。汎用プロセッサと同様に、トップのAIで加速されたSOCを設計できる多くの国内メーカーがあり、主なリスクは高度なプロセスチップの鋳造製造にあります。

CMOSセンサー。ビデオ画像の品質は、顔認識システムの精度に直接関係していますが、ビデオ画像の取得はCMOSセンサーとは切り離せません。 現在、主流のCMOSセンサーサプライヤーには、Sony、Samsung、Ominivison、およびSemiconductorが含まれます。

その中で、ソニーは、コンシューマーエレクトロニクスやセキュリティなどの専門的なアプリケーション分野であろうと、長期的な技術的蓄積で高い市場シェアを占めています。 Samsungは主に携帯電話などの家電製品で使用されていますが、Ouvian TechnologyおよびSemiconductorでは、セキュリティおよび自動車電子機器の分野に焦点を当てています。 国内のCMOの選択には、Zhongxingwei、Gekeweiなどが含まれますが、それらは主にUSBカメラなどの一部の消費者分野で使用されており、まだプロの市場に参入していません。

流行の発達により、温度測定の需要は急速に爆発しました。 サーマルイメージングセンサーは、軍事および民間人の二重の使用特性のため、Gaode Infrared、Daliテクノロジーなどの特別なイメージングセンサーです。 Hikvisionは、今年4月に革新的なビジネス方法を通じて熱イメージングセンシングへの投資を増やし続けています。 Dahua Co.、Ltd。は、このビジネスに参入するために2018年にFLIRとの協力を確立しました。

メモリチップ。メモリチップは、ラムチップやフラッシュチップなど、スマート端子のコストの大部分を占めています。

汎用サーバーのRAMチップのサプライヤーには、主にSamsung(Sansung)、Hynix(Hynix)などが含まれます。スケール効果のため、韓国のサプライヤーの状態は揺れるのが困難です。 埋め込まれたデバイスにはさらに選択肢があり、Hefei ChangxinやUnigroup Semiconductorなどの国内メーカーも積極的に投資しており、生産段階に参入しています。

SSDで広く使用されているNANDフラッシュと比較して、フラッシュは比較的ニッチであり、主に埋め込みデバイスで使用されています。 私の国のZhaoyiイノベーションは、この分野の主流のサプライヤーの1つであり、世界で4番目に大きい市場ランキングを占めています。 NAND FlashはRAMに似ており、サムスンとHynix、Toshiba、Magnesium、Western Digitalなどに加えて、半導体業界にとって必見の場所です。 中国のYangtzeメモリは、主流製品に匹敵するパフォーマンスを備えた64層3D NANDを発売し、Huawei Mateシリーズのハイエンド携帯電話で使用されています。

他のデバイス。顔認識業界で使用される他のデバイスは、主にパワーチップ、抵抗器、コンデンサ、インダクタ、PCB銅板などを含む、一般的な電子産業のデバイスと似ています。 全体として、国内の供給は基本的に制御可能ですが、高精度の要件の点では、外国のサプライヤーを使用する必要があります。今日、グローバルな産業チェーンが高く開発されているため、あらゆる分野に深い実践者がいて、最高のデバイスのグローバル調達に最適な選択肢があります。

一般的なハードウェア:

ユニバーサルサーバー。顔認識システムにおける一般的なサーバーの主な役割は、ビジネスシステムと管理ノードです。ソフトウェアエコシステムの完全性の観点から、一般的なサーバーは主にX86アーキテクチャですが、ARMやRISC-Vなどの他のアーキテクチャのサーバーはすでに出現しています。 X86サーバーのサプライヤーには、主にDell、Lenovo、Dawn、Inspurなどが含まれています。HuaweiのTaishan Serverは、アームアーキテクチャの典型的な代表です。

サーバーを計算します。 AIサーバーは、生態学的な親しみやすいコンピューティングパワーの要因により、1040T(1枚のカードで130T)を提供できる最新の8カードT4 GPUサーバーであるIntel X86CPU+NVIDIA GPUです。 AIコンピューティング専用に設計されたSOCSの成熟度により、SOCSをアクセラレータカードとして使用することも、費用対効果の高い消費電力に適した選択肢になりました。 在Al SOC 的选择面上, 国内已然走在行业前列, 如华为的昇腾310 芯片, 单颗算力16T, 四颗组成半高的计算卡总算力64T, 但相同算力下功耗只有GPU 的l/7o 其他的如寒武纪的MLU220 和MLU270 、 比特大陆的算丰芯片等, 也都已经取得了应用。

ストレージサーバー。ストレージサーバーは、フェイス認識システムの重要なコンポーネントであり、ストレージタスク用に特別に最適化された特別な機器です。 ハードウェアの形式では、その主な機能は、通常8〜48のハードディスクを含む多くのハードディスクがあることです。効率を確保するために、ハードディスクは通常、主にSASハードディスクまたはSSDです。 SASハードドライブの主なサプライヤーは、SeagateとWestern Digitalですが、SSDのサプライヤーはSSDの競争に積極的に参加しています。 ソフトウェア用のストレージサーバーの最適化は、主にRAIDSマルチマシン分散方法を使用して、保存されたデータのセキュリティを増やし、関連するテクノロジーは比較的成熟しています。

スマートターミナル。スマートフォンやスマート画面を含む一般的なスマート端末は、顔認識アプリケーションの重要な領域です。オペレーティングシステムレベルから、スマート端子は2つのカテゴリに分かれています。 HuaweiとAppleは、チップからオペレーティングシステム、ソフトウェアエコシステムまでのプロセス全体を最適化できる唯一の2つのサプライヤーであることは注目に値します。これは、これらの2社の競争上の利点をある程度説明しています。

基本ソフトウェア:

トレーニングフレームワーク。現在、ほとんどの顔認識アルゴリズムはディープラーニングテクノロジーに基づいており、Tensorflowx Pytorch、MXNet、およびCaffeは最も一般的に使用されるトレーニングフレームワークです。 大規模なカテゴリと多様な損失の特性により、上記の深い学習フレームワークは、表現のオープンソースフレームワークの特性に基づいてさらに最適化および拡張する必要があります。業界では、各企業には、データ、トレーニング、展開、その他のリンクのコラボレーションを実現するための独自のトレーニングプラットフォームがあることがよくあり、いくつかの優れた内部フレームワークが徐々に開かれています。 ただし、トレーニングフレームワークの学習を切り替えるコストが高いため、全体的な生態学的構造を強化する必要があります。

推論エンジン。推論エンジンはトレーニングフレームワークに対応し、主にデバイス側のモデルの効率的な(順方向)操作に使用されます。一部のトレーニングフレームワークには、対応する推論エンジンが添付され、トレーニングフレームワークとは無関係に推論エンジンソフトウェアもあります。 さらに、ディープラーニングチップは、加速を実現するためにそれぞれの推論エンジンソフトウェアも提供します。 推論エンジンは特定の構造またはハードウェアに対して深く最適化されることが多いため、一部の新しいネットワーク構造はスケーラビリティまたは最適化効率が低いため、新しいアルゴリズムを迅速に実装できないようにすることができます。

その他のリンク。深い学習ニューラルネットワークに加えて、顔認識の完全なプロセスには、画像の前処理、機能後処理、その他のプロセスも含まれます。 現在、特にチップ側では、効果的で一般的な実装方法が不足しており、画像処理の機能と比較などの数学的操作が欠落しており、開発コストのパフォーマンスの損失が増加しています。

アルゴリズムテクノロジー:近年の深い学習の開発により、中国、米国、日本、ヨーロッパ、その他の国々を含む、世界中に多くの関連する研究チームが進歩しています。 2020年10月のNISTFRのテスト結果によると、世界のトップ10アルゴリズムの半分以上は中国から来ています。

さまざまな国の顔認識アルゴリズムにはパフォーマンスの違いがありますが、ギャップは大きくありません。 FR-Machi Visa Testセットを例にとると、100万分の1の誤報を伴う上位30のメーカーのパフォーマンスが99%を超えたり、近づいたりしました。 顔認識の技術開発は、アルゴリズムの精度の向上に焦点を当てることから、実際のアプリケーション効果の改善にシフトし、以下のアプリケーションの傾向が現れました。

シンプルなシーンから複雑なシーンに変身します。業界では、単純なシーンの顔認識の正確性が飽和する傾向があることがコンセンサスとなっており、業界は複雑なシーンに注意を向け、特定のアプリケーションシナリオに反映しています。 高解像度、小さな姿勢、および中程度の照明を備えた高品質のフェイスマウントシーンから、低解像度、大きな姿勢、低照明、ぼやけなどの低品質のオープンシーンに変換されると、これは顔認識アルゴリズムの適応性に新たな課題をもたらし、業界が改善する方向にもなります。

3Dフェイスは、2017年にiPhone XでFace IDの最初の導入の重要な方向になりました。 2D顔と比較して、3D顔には豊かな顔情報が含まれており、回転、閉塞、照明、写真攻撃などのための干渉防止機能が向上しています。 アクセス制御と出席者と財務支払いに代表される緊密な協力申請では、3D顔が徐々に一般的な技術的ソリューションになりました。

多双様体融合が新しい傾向になっています。多双様体融合は、単一の生物学的特性の欠点を補い、補完的な利点を達成し、システムの精度を向上させ、アプリケーションエクスペリエンスを改善することができます。 範囲の協力アプリケーションでは、顔認識と虹彩認識技術の統合は、双子などの顔認識を解決するのが難しい問題を解決し、カメラの角度や解像度などの問題を拡大することができます。

顔認識における公平性の問題は、緊急に解決する必要があります。セキュリティやプライバシーの懸念、後方の経済的および技術レベル、貿易障壁などの要因により、世界の顔認識技術の全体的な人気は依然として比較的低く、不均衡な開発現象があります。 Nistの分析レポートによると、ヨーロッパ、米国、アジアは、さまざまな国のアルゴリズムの最適化の主なサプライヤーです。 精度の継続的な最適化に加えて、世界中のセキュリティ、プライバシー、公平性などの問題を緊急に解決する必要があります。

機器と製品:

フェイスキャプチャマシン:フェイスキャプチャマシンには、組み込みのAIチップとディープラーニングアルゴリズムがあります。これは、密集した群衆のあるチャネル、入り口、出口などのさまざまなシナリオのニーズに適応し、群衆の顔の正確なキャプチャを実現します。 フェイスキャプチャマシンは、現在、バスステーション、鉄道、空港、港、エンターテイメント会場、通り、コミュニティへの適応などの複雑な人事シーンの主要な監視エリアに広く展開されています。 大きな姿勢、閉塞、異常な照明などの複雑な状況での顔のキャプチャの成功率、および自然監視環境でのエラーキャプチャ率はすべて、機器のパフォーマンスの反映であり、ユーザーが選択できる基礎でもあります。

セキュリティ監視におけるインテリジェンスの開発により、より洗練された包括的な構造化された情報を把握する傾向になりました。現在、大手メーカーは、顔、人体、車両、ナンバープレートなどの多次元情報をキャプチャするビデオ構造化アプリケーションを立ち上げており、マルチAIアルゴリズムとマルチチャネルリアルタイムキャプチャの必要性を発表し、フロントエンドの機器メーカーがアルゴリズムモデルをさらに圧縮し、処理速度を改善する必要があります。 さらに、フロントエンドのデバイスはバックエンドサーバーから分離されており、その機能は単純に情報をキャプチャすることから、キャプチャ、分析、意思決定に至ります。

アクセス制御機器:アクセス制御機器は、顔認識テクノロジーを備えたアイデンティティ認識端子製品です。 現在、市場のアクセス制御製品は比較的成熟しており、深刻な均一性を持っていますが、いくつかの新しい傾向も示しています。

アクセス制御機器の普及と民間使用により、安全性の問題はますます注意を払っており、総占領防止機能が標準になっています。 攻撃方法の多様性のため、摂取防止機能を備えた機器でさえ、テクノロジーの不足や適応性の低いなどの問題があり、セキュリティパフォーマンスを継続的に改善および改善する必要があります。 今年は、流行制御が必要なため、統合された温度測定機能を備えたアクセス制御機器が徐々に一般的になりました。 将来的には、パーソナライズされたニーズを満たすためのセキュリティと差別化は、アクセス制御製品の重要な開発方向になります。

ネットワークハードディスクレコーダー機器:ネットワークビデオレコーダー(NVR)は、ネットワークを介してIPC(ネットワークカメラ)デバイスが送信したデジタルビデオストリームを受け取り、それらを保存して管理する主な機能です。 NVRデバイスの組み込みの顔の検出および顔認識機能は、保存されたデータの有効性と主要データの検索効率を改善することができ、現在NVRデバイスの主要なセールスポイントになりました。

モバイルターミナル:フェイススキャン機能の普及により、携帯電話は徐々に顔認識のための重要な端末の1つになり、フェイススキャンのログインとフェイススキャンの支払いを携帯電話で完了することができます。 従来のパスワードのロック解除と支払いと比較して、フェイススキャンは利便性とセキュリティが高くなります。 将来的には、スマートフォンでの顔認識の人気がさらに増加し​​、ますます多くのモバイルアプリケーションがアイデンティティの検証に顔の認識を使用します。

フェイス分析サーバー:深い学習に基づくフェイス認識アルゴリズムは、実際のアプリケーションで大量のコンピューティングリソースを必要とします。 ただし、GPUサーバーはサイズが大きく、エネルギー消費量が多いため、多くのアプリケーションシナリオで人工知能の開発を制限するボトルネックになりました。

フェイス認識に基づく分析的オールインワンマシンまたはサーバーは、パフォーマンス、コスト、消費電力、信頼性、アプリケーションの範囲において明らかな利点があります。 多くの実用的なアプリケーションシナリオでは、専用の分析的オールインワンマシンまたはサーバーは、エネルギーを消費し、ボリュームを減らし、同じコンピューティングパワーを提供する際の熱が少なくなります。 たとえば、「Quisearch」チップを備えた1U Yitu Atomic Serverは、8カードNVIDIA P4サーバーと比較して、単一の電力消費量の10%未満です。

フェイス比較サーバー:スマートシティや1人、1つのファイル、1つのファイルなどのフェイスビッグデータを適用すると、フェイスフィーチャの比較でサポートされているライブラリサイズ、並行性ボリューム、および応答速度が提案され、専用の比較サーバーが生成されます。生態学的に友好的で高いコンピューティングパワーにより、GPUカード比較サーバーは、さまざまな業界のアプリケーションの大部分を占めています。分析サーバーと同様に、GPUには、サーバーと比較して、大きなサイズと高出力消費の不利な点があります。

FPGAチップは、ライブラリ容量が大きく、FPGAベースのフェイス比較サーバーが高いことは、パフォーマンス、レイヤーブック、消費電力などの明らかな利点があり、そのタイプの製品がマークを獲得しています。 さらに、CPUチップコンピューティング機能と命令セットの継続的な最適化により、CHIPメーカーとサーバーメーカーもCPUベースのフェイス比較サーバー製品を共同で試しており、CPUベースの製品ソリューションも注意を払う価値があります。

解決:

顔認識システムのビジネス機能には、主に顔の確認、顔の制御、顔の検索、顔のクラスタリングなどが含まれます。上記のさまざまなデバイスを通じてさまざまなソリューションを構築できます。 アプリケーションのシナリオとデータスケールによれば、ソリューションはFace Antaster Solutions、Face Layout Control Solutions、Face Big Data Application Solutionsに要約できます。

フェイスの出席ソリューション:フェイスの出席ソリューションは、単一のアクセス制御デバイスで構成されています。または、フェイスキャプチャ + NVR、またはフェイスキャプチャ、フェイスモデリング、顔の比較機能を含む、および出席許可、データストレージと削除、パラメーターの設定、プライバシー保護を備えた管理システムが装備されています。

フェイスコントロールソリューション:フェイスコントロールソリューション。通常、フェイスキャプチャマシンとフェイス分析サーバーで構成されています。 当单台人脸分析服务器不足以提供所需性能时, 可以采用多集群方式; 当系统需要接入传统IPC 视频码流时, 亦可在分析服务器实现人脸抓拍。

人脸大数据应用解决方案:省级、 全国级静态库检索, 市/ 县级人脸聚类是常见的人脸大数据应用,其解决方案通常由人脸抓拍机+人脸分析服务器+人脸比对服务器构成, 其系统通常为分布式系统, 图像处理单元和特征比对单元按照应用所需的处理并发数进行部署。 该类系统通常与其他智能分析系统(如人体分析、 步态分析)进行打通, 并利用大数据分析技术进一步提升系统的可用性和整体性能。

不同厂家人脸产品形态有所差异, 但其人脸产品的核心功能大同小异, 因此由人脸产品组成的人脸识别系统功能和流程相对固定, 上述解决方案具有极高的通用性。 产业链中基础层、 算法和设备的发展主要在于提升人脸识别的效果和效率, 不会影响整体功能和流程, 解决方案是相对稳定的环节。

3、典型应用领域
科技金融。人脸识别在金融领域的应用已经相当普遍, 如远程银行开户、 身份核验、保险理赔和刷脸支付等。 人脸识别技术的接入, 能有效提高资金交易安全的保障, 也提高了金融业务中的便捷性。

2013 年芬兰公司Uniqul 成为首批吃螃蟹的公司, 面向全球首次推出人脸识别支付这一创新支付技术。 2015 年在德国汉诺威CeBIT 展会上马云第一次向德国总理默克尔展示了支付宝的人脸识别支付技术。 同年, 招商银行在一些支行柜面和ATM业务也开始应用人脸识别, 随后包括建设银行、 农业银行等四大行在内的数十家银行都纷纷将人脸识别产品引入ATM 、 STM 、 柜面、 网点、手机银行等各个业务环节, 并逐渐全客户覆盖。

时至今日, 人脸识别技术在国内金融领域已经得到了非常广泛的部署和应用, 消费者在各个渠道中都可以利用人脸识别技术使用金融服务,中国在人脸识别技术的应用上已经大幅度领先国外市场。

智慧安防。安防是人脸识别市场最早渗透、 应用最广泛的领域。 根据亿欧研究, 2018年, 安防行业在中国人脸识别市场占比61.2% 。 当前人脸识别技术主要为视频结构化、 人脸检索、 人脸布控、 人群统计等软硬件一体形态产品提供基础支撑,重点应用于犯罪人员的识别追踪、 失踪儿童寻找、 反恐行动助力等场景。

视频监控系统通过庞大的监控网络进行图像采集、 自动分析、 人脸比对, 基于视频帧的1 : 1 及1 : N 人脸比对, 可分析人员轨迹、 出行规律等, 实现重点人员的识别及跟踪, 在公安应用场景中达到事前预警、 事中跟踪、 事后快速处置的目的。 在雪亮工程、 天网工程、 智慧社区、 反恐及重大活动安保等公安项目发挥了重要的作用。

此外, 在企业楼宇、 社区住宅的人员管理和安全防范需求场景下, 人脸识别技术应用非常广泛, 通过人脸的黑白名单录入, 可有效管控区域人员出入,机器识别的高效率也大幅节省了人力资源。

スマートな交通手段。国外的公共交通领域对人脸识别技术的应用主要集中在机场安检以及入境管理等特别强调安全的场景。 加拿大渥太华国际机场、 澳大利亚当地移民及边境保护局与美国海关与边境保护局皆已尝试部署人脸识别出入境系统。

国内交通领域的人脸识别应用主要包括1 : 1 人脸验证和1 : N 人脸辨识。目前利用人脸核验证技术的刷脸安检已进入普遍应用阶段, 在高铁站、 普通火车站和机场皆已大面积推广。 而应用1 : N 人脸比对技术的刷脸支付主要落地在地铁公交等市内交通, 这种技术能够极大提高通勤人员的出行效率, 释放大量的人力资源, 提升出行体验。 同时, 人脸识别可以对交通站点进行人流监测,根据人员出行规律预测交通人流高峰, 提前做好疏导预案。

除此之外, 在交通违规管控方面, 人脸识别技术可以帮助执法人员更快速高效地找到违规人员身份信息, 并结合车辆识别等技术进行跟踪拦截。

民生政务。政务互联网平台、 公积金、 社保、 税务、 网证、 交通管理、 行人闯红灯、缴交交通罚款、 住建等民生政务系统, 已经使用或正在使用人脸识别系统。 政务服务领域的业务点主要有私有云平台搭建、 政务服务自助终端、 便民服务平台。 人脸识别在政务系统的落地, 提升了民众的办事效率, 公民可以不用窗口排队, 实现自助办事, 节省了因人工效率低下产生的耗时。 部分政务还可以通过在线人脸识别认证, 在移动端线上办理, 减轻了“ 办事来回跑、 办事地点远、办事点分散” 的困扰。

教育考试。智慧教育在高速发展的同时, 不断深入采用物联网、 云计算、 大数据等先进信息技术手段, 实现各种教育管理与教学过程数据的全面采集、 存储与分析,并通过可视化技术进行直观的呈现。

在这个过程中, 相关科技企业基于自身在人工智能、 视频可视化技术、 出入口门禁管理、 大数据、 云计算等领域积累的技术产品经验, 致力于推动智慧教育的行业发展, 打造升级智慧校园、 智慧教室、 智慧宿舍、 智慧图书馆、 智慧食堂、 智慧超市等教育相关的安全管控、 课堂考勤、 刷脸消费和智能化体验。同时, 人脸识别技术也应用在考生身份确认。

智能家居。人脸识别在智能家居中主要应用在安全解锁和个性化家居服务两个场景。在安全防范方面, 人脸识别可以提供相对安全和便捷的入户解锁技术, 将可能逐步替代传统密码或指纹门锁。 智能门铃可以通过人脸识别对访客身份进行识别。 另外家中的监控摄像头可以实时监测, 如发现陌生人脸立即提醒住户并报警。

在个性化家居服务方面, 智能电视可以采用人脸信息录入的方式创建账号,机器通过人脸识别认证, 有针对性的进行内容推送, 实现个性化定制; 智能冰箱可通过人脸识别技术, 针对不同的用户爱好、 人脸状态, 推送菜谱及营养建议。 人脸识别技术在智能家居行业的应用, 为市民带来了更便捷、 舒适的生活方式。

4、 行业发展趋势<br /> 应用场景向各行业渗透, 市场规模增长趋势出现分化。随着技术发展和安全性要求的提高, 人脸识别技术在行业应用中发生巨大变化, 从安全性可靠性要求较低的行业上升到金融社保、 证券、 银行、 互联网金融等安全可靠性要求较高的行业。我国人脸识别技术目前主要运用在公共安防、 门禁考勤、 金融支付三大领域。

区分不同的应用领域来看, 其趋势逐渐出现分化。 从2019 年看, 安防作为人脸识别最早应用的领域之一, 其市场份额占比在30% 左右。 随着雪亮工程、 智慧城市建设的逐步完成, 人脸识别在安防领域逐渐从增量市场转变为存量市场。 人脸识别在门禁考勤领域的应用最为成熟, 约占行业市场的42% 左右, 随着智慧楼宇、 智慧社区、 智慧家居的进一步发展, 人脸识别门禁考勤市场也将随之增长。 金融作为人脸识别未来重要的应用领域之一, 目前约占行业的20%, 并且市场规模在逐步扩大。

全球公共卫生环境变化, 人脸识别迎来应用新需求。新冠肺炎疫情的爆发并在全世界流行, 威胁人类生命安全与健康, 引发了一场全球公共卫生危机。 相对于指纹、 刷卡等接触式身份识别模式, 人脸识别等非接触式识别模式更适用于当前受新冠病毒影响的全球公共卫生环境, 减少病毒通过接触感染人群。

一方面, 人脸识别技术结合红外体温监测技术, 获取人员身体健康状况信息, 能及时反馈并控制疫情源头; 另一方面, 监控系统的全面布控, 可检测获取重点人员流动信息, 帮助政府防控管制措施做到有的放矢。

目前全球公共卫生环境形式依旧严峻, 根据智源发布的《 人脸识别与公共卫生调研报告》 显示, 受访者普遍赞同加强人脸识别技术的能力, 81.9% 的人同意增强对戴有口罩的人的面部识别。 为完善疫情防控体系, 进一步阻断传播源, 戴口罩人脸识别技术的新需求浮出水面。

计算芯片技术发展, 支撑人脸识别大规模应用。人脸识别算法的工业应用和算法性能除了自身模型性能外, 依赖于算法运行的硬件芯片环境。 以英伟达的GPU 和英特尔的CPU 为代表的通用架构芯片作为人脸识别算法训练和推理最常用的计算资源。

同时, 为了满足人脸识别应用场景的不断拓展和数据量的急剧增长对算力的强烈需求, 基于领域专用架构( Domain Specific Architectures, DSA) 理念的行业专用定制芯片凭借着对特定领域的算法优化, 可以充分发挥计算资源和算法模型的效能, 已经被部分厂商应用于人脸识别算法的训练和推理应用, 如海思、 依图、 寒武纪等企业推出的云端计算芯片, 可以逐渐替代GPU 成为其人脸识别技术应用的主流计算资源。

近年来, 信息量的爆炸式增长给数据传输存储及中心计算带来了巨大的压力, 边缘计算应运而生。 随着AI 芯片技术的飞速发展, 边缘计算设备的算力不断提高, 越来越多的计算由边缘侧承担。 一方面, 边缘计算能有效缓解带宽承载, 提高计算传输效率, 满足实时响应需求, 增强数据安全性; 另一方面,模型压缩及加速技术以及适合人脸识别算法运算的专用AI 芯片不断完善, 边缘设备的人脸识别算法精度持续提升, 目前基于AI 芯片的边缘设备应用基本覆盖社区、 学校、 医院、 园区、 交通等场景, 支撑人脸识别的大规模应用。

云边端协同部署, 人脸识别应用迎来新场景新模式。云边端的协同部署模式将人脸识别应用模块分摊到各部分, 通过前端边缘计算实现布控报警, 边端对人脸特征做聚类分析, 云端汇聚有效信息, 进行大数据对比分析, 开展调度工作。

云边端协同部署方式缓解了云端压力, 支持业务分级响应, 云边结合人脸识别系统通过对云端和边缘端资源的统一配置、 管理、 调度, 融合了边缘计算敏捷性和云端大数据全局性的优势, 使人脸识别系统在带宽、 并发数、 响应速度等维度性能全面提升。

在未来, 边缘端设备的视频编码能力和视频特征抽取能力将进一步加强,AI 应用也会将越来越多的计算承载分摊到前端。 云端则由人像系统、 视频结构化系统、 人脸人体聚类分析等服务组成, 通过分析、 聚类、 归档形成各种主题库, 跟各种业务应用打通, 满足更多复杂场景下的智能化应用需要。

算法技术国际领先, 国内市场竞争激烈。从全球竞争格局上看, 中国公司在人脸识别算法上具备相当大国际竞争力。从最新NIST 主办的人脸识别算法测试FR 町来看, 参加评测的供应商有207 家,其中中国大陆供应商有31 家。 在其公布的几个主要测试集上, 共有7 家中国人脸识别算法供应商取得过前三, 5 家取得过第一, 且在近一年内保持这一优势。 总体来说, 中国的人脸识别算法在国际上已处于领先地位。

国内市场竞争激烈一方面体现在竞争厂商多, 包括传统安防企业、 AI 初创企业和平台生态企业。 传统安防企业从安防市场出发, 对安防视频行业的痛点和客户需求理解较深, 拥有产品+集成的优势, 已构建起很强的规模效应壁垒。

AI 初创企业主要是一些新兴的专注于做算法的计算机视觉( CV ) 初创企业,以AI 算法为核心优势, 同时兼顾“ 硬件落地” 及“ 产品化”。 平台生态企业,依托其强大的云平台以及云计算能力, 以云平台为核心横向切入, 整合合作伙伴的应用方案, 构建统一的生态体系, 并形成差异化竞争。

国内市场竞争激烈另一方面体现在全产业链竞争, 从算法竞争延伸到芯片和平台竞争。 主要市场参与者都已经加入AI 芯片竞争中, 安防企业注重边缘侧和端侧的推理芯片, 初创公司更注重边缘侧推理芯片, 而平台生态企业则注重端/ 云一体, 构建从训练到推理的全栈AI 生态。 下游的竞争主要是应用层的竞争, 是生态的竞争, 是深耕行业的竞争。

四、人脸识别标准化
1、 标准化组织情况
<br /> 国际标准化方面, 人脸识别标准化工作主要属于生物特征识别标准化分技术委员会(ISO/IEC JTC1/SC37 ) 工作范畴, 其重点关注人脸识别基础标准, 如图示图标符号、 样本质量等, 以及数据交换格式及符合性测试方法等。

其它关注人脸识别的国外先进组织包括电气与电子工程师协会( Institute of Electrical and Electronics Engineers, IEEE) 、 美国消费技术协会(Consumer Technology Association, CTA) 等,其关注的方向在于生物特征识别呈现攻击检测、 人脸生物特征识别信息的性能评估等。 ITU 与生物特征识别标准相关的主要是ITU-T SG1 7 安全标准工作组下设的Q9 和Q10 。 Q9 主要关注在通信应用环境中应用生物特征识别及其标准化工作。

随着生物特征识别技术在电子商务、 电子健康和移动支付领域中的广泛应用, 该工作组同样关注生物特征数据的隐私保护、 可靠性和安全性等方面的各种挑战。 Q10 关注身份管理架构和机制, 部分标准项目与基于生物特征识别身份认证相关。 进几年, ITU-TSG16 媒体工作组基于视频监控、 机器视觉等应用场景、 功能需求、 业务需求、 性能需求以及安全需求, 在Q12 、 Q21 等课题组先后开展人脸识别标准的研究和制定工作。

国内组织方面, 主要是全国信息技术标准化技术委员会生物特征识别分技术委员会( SACOC28/SC37 ) 和全国安全防范报警系统标准化技术委员会人体生物特征识别应用分技术委员会(简称SAC/TC100/SC2 ) 负责生物特征识别标准的制定。 其中SACATC28/SC37 成立了人脸识别、移动设备生物特征识别等多个工作组, 发布了人脸样本质量、 人脸图像数据交换格式、 移动设备人脸识别等标准。 SA5C100/SC2 发布了视频监控、 出入口控制等公共安全领域的多项人脸识别标准。

此外, 国内组织方面, 全国防伪标准化技术委员会( SAC/TC218 ) 发布了国家标准《 生物特征识别防伪技术要求第1 部分: 人脸识别》 。 全国金融标准化技术委员会( SAC/TC 180 ) 发布了国家标准《 金融服务生物特征识别安全框架》 , 并且正在制定《 人脸识别技术线下支付安全应用规范》 等生物特征识别行业标准。

公安部社会公共安全应用基础标准化技术委员会发布了行业标准《 视频图像分析仪第4 部分: 人脸分析技术要求》 。 全国信息安全标准化技术委员会( SAC/TC260 )发布了国家标准《 信息安全技术远程人脸识别系统技术要求》 等。

2、标准制修订情况<br /> 国际标准化组织和其他国外先进标准组织人脸识别相关的标准统计情况见下表。

ISO 国际标准统计表

我国人脸识别相关的标准情况见下表。

我国人脸识别相关的标准情况见表

当前, 我国的人脸识别技术与应用在国际上处于领先地位,在科技金融、 智慧安防、 智慧交通、 民生政务、 教育考试、 智能家居等多个领域得到了广泛应用。但是,近一年人脸识别技术也出现了很多不良影响,“售楼处暗藏人脸识别”、人脸信息泄露等问题屡见不鲜。随着技术门槛的逐步降低,加强安全技术的研发和应用,完善相关的法律法规变得尤为重要。

<<:  なぜ人工知能には膨大な電力需要があるのでしょうか?

>>:  時空間AI技術:スマートシティ分野における深層強化学習の応用入門

ブログ    
ブログ    

推薦する

慎重なソート - よく使われる 10 のディープラーニング アルゴリズム

過去 10 年間で、機械学習への関心は爆発的に高まりました。機械学習は、コンピューター プログラム、...

...

スタートアップ企業がAIと患者チップを組み合わせて医薬品開発を加速

動物実験の必要性は新薬発見のプロセスにとって残念な事実であり、マウスは特に人間を正確に模倣しているわ...

GoogleのチーフAIサイエンティスト、フェイフェイ・リーがスタンフォード大学のAIラボを離れ、再び戻る可能性

BI中国語ウェブサイトが6月28日に報じた。グーグルの主任人工知能(AI)科学者、フェイフェイ・リー...

Java 配列から HashMap へのアルゴリズムの説明

1. 配列とは何ですか?どの本にこのような文章があったか忘れましたが、「すべてのデータ構造は配列の進...

30 行の JavaScript コードで、わずか数分でニューラル ネットワークを作成する方法を学びます。

[[203712]]ニューラルネットワークを自分で構築するのは複雑すぎますか? [[203713]...

空飛ぶ車の将来展望は?

空飛ぶ車というアイデアは何十年も私たちの想像力をかき立て、交通渋滞の上を飛ぶことができる未来のビジョ...

コミック版:ディープラーニングって何?

Google はどのようにしてわずか数秒で Web ページ全体をさまざまな言語に翻訳するのか、ある...

社内抗争、顧客獲得競争…マイクロソフトとOpenAIの協力の裏側を海外メディアが暴露

Microsoft と OpenAI の提携は、現在テクノロジー界で最も注目されているものの 1 つ...

...

プレミアリーグファンに朗報:AIはチームの勝率とゴール時間を予測できるのか?

[[423663]] 2021-22シーズンのイングランド・プレミアリーグが開幕し、初日にアーセナ...

人工知能認識により、物流会社はダブルイレブンの注文に簡単に対応できます。

2018年のダブルイレブンは、「富豪」に対する私の認識を新たにしました。その前に、アリババの張勇は...

AI分野で世界で最も影響力のある機関トップ100のランキング、中国の機関6つがランクイン

[[243888]]現在、「人工知能」という言葉は主要メディアプラットフォームで頻繁に登場し、注目を...

データサイエンス技術の未来

[[361283]]画像ソース: https://pixabay.com/images/id-477...