マイクロモード動的顔認識制御システムソリューション

マイクロモード動的顔認識制御システムソリューション

マイクロモードの動的顔認識制御システム、インテリジェントビデオ監視は、元のビデオ監視に基づいてインテリジェントビデオ分析機能を追加します。システムは、設定された制御計画に従って、各監視シーンに異常があるかどうかを自動的に判断できます。異常が発生すると、システムは自動的にアラームを生成します...

[[358635]]

序文

経済のグローバル化の影響が深まり、改革開放がさらに進み、都市化のペースがますます加速する中、都市の人口は密集し、流動人口が増加し、交通、社会保障、都市建設の重点分野の予防など、都市管理の問題を引き起こしています。現在の治安情勢の多様化と複雑化、犯罪手段の隠蔽、刑事事件の発生率の高さ、特に近年の都市テロ対策に対する新たな要求は、治安管理、特に犯罪予防と法執行に新たな課題をもたらしています。しかし、現在の公安警察の人員増強は実際のニーズの発展速度に程遠く、人工知能技術や監視カメラ技術の発展に伴い、科学技術手段を直接の戦闘力に変えることができる都市安全画像監視は、この問題を解決する重要な手段となり、事件の直接解決に利便性をもたらしている。

従来のセキュリティ識別方法の欠陥と解決策

従来の監視および識別方法によってもたらされる問題は、まず第一に、人間の信頼性の低い弱点を回避できないことです。常に警戒を怠らず、セキュリティ上の脅威を検出することはできません。注意を維持するのが難しく、重要な画像情報を見逃しがちです。第二に、カメラの数がモニターの数より多く、1:1方式を採用していないため、巡回表示やマルチスクリーンの小さな画像方式では、異常現象を見逃し、事態が悪化する可能性があります。さらに、監視とビデオ録画が分離されており、分析に役立てるために瞬間的な画像を保存したり、ビデオをすばやく取得したりすることができません。最後に、現在のビデオコンテンツは、事後の参照用のみであり、異常な状況や緊急事態が発生した場合、損失と影響は回復不可能であり、受動的な監視に属します。

マイクロモード動的顔認識制御システムソリューション

マイクロモードの動的顔認識制御システム、インテリジェントビデオ監視は、元のビデオ監視に基づいてインテリジェントビデオ分析機能を追加します。システムは、設定された制御計画に従って、各監視シーンに異常な状態があるかどうかを自動的に判断できます。異常な状況が発生すると、システムは自動的にアラームを生成します。

1. 顔認識技術

1. 顔検出

「顔検出」は画像内の顔の位置を検出する技術です。

顔検出アルゴリズムの入力は画像であり、出力は顔フレーム座標のシーケンス (0 つの顔フレーム、1 つの顔フレーム、または複数の顔フレーム) です。一般的に、出力される顔座標フレームは上向きの正方形ですが、一部の顔検出技術では上向きの長方形や回転方向の長方形が出力されます。

一般的な顔検出アルゴリズムは、基本的に「スキャン」と「識別」のプロセスです。つまり、アルゴリズムは画像範囲内をスキャンし、候補領域が顔であるかどうかを 1 つずつ判断します。したがって、顔検出アルゴリズムの計算速度は、画像のサイズと画像の内容に関係します。開発プロセス中に、「入力画像サイズ」、「顔の最小サイズ制限」、または「顔の数の上限」を設定することで、アルゴリズムを高速化できます。

2. 顔登録

「フェイスアライメント」は、顔の特徴の重要なポイントの座標を特定する技術です。

顔登録アルゴリズムの入力は「顔写真」と「顔座標フレーム」であり、出力は顔の特徴のキーポイントの座標シーケンスです。顔のキーポイントの数は事前に設定された固定値であり、さまざまなセマンティクスに応じて定義できます (一般的なものは 5 ポイント、68 ポイント、90 ポイントなど)。

より良い結果をもたらす現在の顔登録技術のいくつかは、基本的にディープラーニング フレームワークを通じて実装されています。これらの方法は、顔検出の座標フレームに基づいています。顔領域は、事前に設定された特定のルールに従って抽出され、固定サイズに拡大縮小されてから、キー ポイントの位置が計算されます。したがって、画像のスケーリング処理の時間消費を考慮しない場合、顔登録アルゴリズムは計算量が固定されたプロセスです。さらに、顔検出や後述する顔特徴抽出プロセスと比較すると、顔登録アルゴリズムの計算時間は大幅に短縮されます。

3. 顔属性認識

「顔属性認識(FaceAttribute)」は、性別、年齢、姿勢、表情など、顔の属性値を識別する技術です。

一般的な顔属性認識アルゴリズムの入力は「顔画像」と「顔の特徴のキーポイントの座標」であり、出力は顔の対応する属性値です。顔属性認識アルゴリズムは、一般的に、顔の特徴のキーポイントの座標に従って顔を位置合わせし(回転、拡大縮小、減算などの操作の後、顔を所定のサイズと形状に調整します)、その後、属性分析を実行します。

従来の顔属性認識アルゴリズムは、各顔属性を認識するために独立したプロセスを使用します。つまり、顔属性認識は、アルゴリズムのクラスに対する一般的な用語にすぎません。性別認識、年齢推定、姿勢推定、表情認識はすべて独立したアルゴリズムです。ただし、ディープラーニングベースの顔属性認識の中には、性別、年齢、姿勢などの属性値を同時に 1 つのアルゴリズムに入力できるものもあります。

4. アルゴリズムの効果を基本的に確保することを前提に、モデルサイズと動作速度をモバイル端末で使用できる状態に最適化する

5. 顔照合(顔検証、顔認識、顔検索、顔クラスタリング)

「FaceCompare」は2つの顔の類似性を測定するアルゴリズムです

顔比較アルゴリズムの入力は 2 つの顔の特徴 (注: 顔の特徴は、前の顔の特徴抽出アルゴリズムによって取得されます) であり、出力は 2 つの特徴の類似度です。顔の検証、顔の認識、顔の検索はすべて、顔の比較に基づくいくつかの戦略を追加することによって実現されます。顔の特徴抽出プロセスと比較すると、単一の顔の比較にかかる時間は非常に短く、ほとんど無視できます。

顔の比較に基づいて、顔検証 (FaceVerification)、顔認識 (FaceRecognition)、顔検索 (FaceRetrieval)、顔クラスタリング (FaceCluster) などのアルゴリズムを導き出すことができます。

6. 顔認証

「顔認証」とは、2つの顔画像が同一人物のものかどうかを判定するアルゴリズムです。

入力は 2 つの顔の特徴です。2 つの顔の特徴の類似性は顔の比較によって取得され、事前に設定されたしきい値と比較して、2 つの顔の特徴が同一人物に属するかどうかが検証されます (つまり、類似性がしきい値より大きい場合は同一人物であり、しきい値より小さい場合は異なる人物です)。

7. 顔認識

「顔認識」は、入力された顔画像に対応する本人を識別するアルゴリズムです。

入力は顔の特徴であり、データベースに登録されている N 個の ID に対応する特徴と 1 つずつ比較され、入力された特徴と高い類似性を持つ「 1 つの」特徴が検索されます。この高い類似度値を、事前に設定されたしきい値と比較します。しきい値より大きい場合は、機能に対応する ID が返され、そうでない場合は「ライブラリにありません」が返されます。

8. 顔検索

「顔検索」は、入力された顔に類似した顔のシーケンスを見つけるアルゴリズムです。

顔検索では、入力された顔をコレクション内の顔と比較し、比較後の類似性に応じてコレクション内の顔を並べ替えます。類似度に応じて高いものから低いものの順に並べられた顔のシーケンスが顔検索の結果です。

9. 顔のクラスタリング

「FaceCluster」は、顔をその特徴に応じてセットにグループ化するアルゴリズムです。

顔クラスタリングでは、セット内のすべての顔を相互に比較し、類似度の値に基づいて分析して、同じ ID を持つ人々を 1 つのグループにグループ化します。

手動で ID ラベルを付ける前は、グループにまとめられた顔が同じ ID に属していることはわかっていましたが、正確な ID はわかりませんでした。さらに、コレクションにN個の顔があると仮定すると、顔クラスタリングのアルゴリズムの複雑さはO(N2)である。

10. ライブフェイス

「顔ライブネス」とは、顔画像が実在の人物のものか、攻撃用の偽物(写真、動画など)のものかを判別する方法です。

前述の顔認識技術と比較すると、顔の生体検出は単純なアルゴリズムではなく、問題に対する解決策です。このソリューションは、ユーザー インタラクションとアルゴリズムを密接に組み合わせており、異なるインタラクション メソッドは完全に異なるアルゴリズムに対応します。方法の種類が多すぎるため、ここでは「顔のライブネス」の概念のみを紹介し、詳しく説明しません。

2. 装備システム構成

マイクロモードダイナミック顔制御システムは、顔認識のコアアルゴリズムに基づくインテリジェントシステムです。密集した人や重要な人員を管理する場所の入口チャネルに顔画像取得カメラを配置することで、システムは検索を通じて収集された顔画像を顔画像ライブラリと比較します。比較に成功すると、容疑者はすぐにロックされ、手動分析の支援を受け、早期警告情報が責任部署または管理担当者の端末に送信され、関係者が処分作業を実行します。このシステムは、主要な管理者を迅速かつ正確に識別することができ、セキュリティの重要な手段であり、広く使用されています。

システム機器:

顔画像取得端末:

1. 顔キャプチャカメラ

カメラで顔を撮影すると、カメラは撮影した顔画像に対して顔の重複除去や顔品質評価などの処理を自動的に実行します。最後に、合格した顔写真画像はバックグラウンドに送信され、主要人物の顔データベースとの識別、比較、検証が行われます。

2. 一般的なネットワークカメラ

エリアはネットワークカメラで監視され、カメラは自動的にビデオストリームを取得して顔検出サーバーに送信します。顔検出サーバーは、ビデオストリームに対して顔検出、顔の重複排除、顔の品質評価などのプロセス操作を実行します。最後に、合格した顔写真画像はバックグラウンドに送信され、主要人物の顔データベースとの識別、比較、検証が行われます。

製品機能紹介:

1. 市町村局の権限区分:市町村局は支局に権限を付与し、異なる口座を割り当てて多口座情報共有を実現します。

2. 早期警報伝達:SMS、WeChatなどの方法で制御端末に送信され、主要人物の情報がリアルタイムで取得されます。

3. 調査・判断ツール:事件の調査状況に応じて、時間や地域などに基づいて主要人物を監視・追跡できます。

4. セーフ シティ ビデオ相互接続: セーフ シティ ビデオ監視と相互接続して主要人物を監視します。

5. 公安局プラットフォームとの接続:公安システムプラットフォームに接続し、早期警報情報をリアルタイムで送信します。

6 応用分野:鉄道駅、バス停、地下鉄駅、バス停、空港など、混雑した場所、大規模会議のセキュリティ、主要人物の一時的な管理。

3. いくつかの応用シナリオ

1. 教育産業:

幼稚園、小学校、中学校でキャンパスの安全性を向上させるために使用されています。学校の生徒、教師、保護者を素早く識別し、見知らぬ人の侵入や子供のなりすましを防ぎます。さまざまな主要な試験では、顔認識技術を使用して受験者の身元を確認し、偽の証明書で受験したり、他人に代わって試験を受けるなどの望ましくない現象を防ぐことができます。試験室では、不正行為を防ぐために試験の全過程を監視できるため、試験の公平性が確保されるだけでなく、学校の人件費も大幅に削減されます。

2. 治安業界:

一部の公共の場所にカメラを設置し、動的な顔認識を使用して状況を制御すれば、警察官は反復的で複雑なビデオ監視から解放される可能性があります。高解像度カメラで顔を撮影し、それを大規模なデータベースと比較することで、警察は主要人物の移動経路を簡単に把握できる。空港、駅、港、地下鉄の要所、大型スーパーマーケットなどの混雑した公共の場所で広く使用され、一部の重要人物の検査や逃亡者の逮捕の目的を達成できます。

<<:  人工知能はクラウドストレージとデータサービスの革新を推進する

>>:  Github が絶賛: モザイクテキスト = 無意味、AI があなたの思考をすべて見抜く、オープンソースに

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

顔認識技術が「無人小売」時代の到来を牽引

序文:顔認識は現在最も人気のある人工知能技術として、生産と生活のあらゆる側面で広く使用されています。...

...

Kmojiの魔法の表情を支えるAI技術

2018年7月、Kuaishouはかわいい魔法の絵文字を発表し、iPhone XのAnimojiゲー...

人工知能: Web3 の救世主か破壊者か?

ブロックチェーン技術の発展に伴い、Web3(分散型Webとも呼ばれる)が徐々にWeb2(集中型Web...

科学:ChatGPTは労働者と非労働者の間の格差を縮小する

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

TensorFlow レビュー: 最高のディープラーニング ライブラリ、そして今も進化中

[51CTO.com クイック翻訳] バージョン r1.5 のリリースにより、Google のオープ...

作業員にとって、端末に大きなモデルをインストールすることは、祝福でしょうか、それとも呪いでしょうか?

さまざまな業界の労働者は、当初は AI に取って代わられるのではないかと心配していましたが、今では ...

教師なしトレーニング用のスタック型オートエンコーダは時代遅れですか? ML博士が8つのオートエンコーダを比較

ベルリン工科大学のディープラーニング博士課程の学生であるティルマン・クロコッチ氏は、複数のタスクにお...

ビル・ゲイツ氏:GPT-5はGPT-4よりそれほど良くはならない、生成AIは限界に達した

ビル・ゲイツ氏の暴露は機械学習コミュニティで話題となっている。 「GPT-5 は GPT-4 よりそ...

ワイツマンとNVIDIAは、自然言語を使って写真を編集できるText2LIVEを共同でリリースした。

Photoshop のようなソフトウェアを使用することは、創造的な作業とみなされますか、それとも反...

...

自然言語処理にディープラーニングを使用するにはどうすればよいでしょうか?ベストプラクティスのリストはこちら

この記事の著者である Sebastian Ruder は、自然言語処理にディープラーニングを使用する...

MITの研究者はAIを使って自動運転車が赤信号でアイドリングを回避できるように支援する

ドライバーが毎回信号を直進できるように旅行を計画できたらどうなるでしょうか?これは、特に幸運な状況下...

...