機能は完全に破綻。一目見るだけで解錠や支払いができた人工知能は、今や「役立たずのゴミ」のようになってしまった。 いいえ、ネットユーザーたちは不満を述べています。 一部のネットユーザーは、大手携帯電話メーカーが新しい機能を開発することを提案した。 当初、AI顔認識技術は個人の身元認証の重要な方法であり、犯罪者の写真管理や犯罪捜査、事件解決に使用されていることはわかっていました。現在、この技術はセキュリティシステムや取引システムに広く応用されています。 現在、私たちはこの機能に毎日頼っています。 朝起きたら、携帯電話を見るだけで自動的にロックが解除されます。 オンラインショッピングの「顔スキャン」決済。 買い物をするときに現金を持ち歩く必要がなく、機械の前で「顔をスキャン」するだけで支払いができ、仕事でも「顔をスキャン」するだけで出勤できます。 高速鉄道や飛行機にペーパーレスの「顔スキャン」セキュリティチェックチャネルが導入される予定だ...... 日常生活のあらゆる分野に徐々に統合されてきたこの技術は、私たちの生活に多大な利便性をもたらしました。次に、この技術を簡単に学んでみましょう〜 01. AI顔認識 顔認識は、コンピュータービジョンとパターン認識の交差点であり、この 2 つを組み合わせたものです。 1980 年代後半には、神経生理学、脳神経学、視覚知識が顔認識に導入されました。コンピュータ技術の急速な発展とコンピューティング コストの急速な低下と相まって、大規模なサンプルの導入、多次元の特徴パラメータの抽出、モデリングなど、以前は時間とスペースを消費していたいくつかのパターン マッチング アルゴリズムが可能になりました。 顔認識の分野の研究は、理論的価値が高いだけでなく、実用的価値も高く、顔の特徴に基づいて人物を識別する生体認証技術です。 02. フィールドを特定する 顔検出 画像内の顔を検出して位置を特定し、高精度の顔フレーム座標を返すことを指します。これは、顔の分析と処理の最初のステップです。 初期検出プロセスは「スライディング ウィンドウ」と呼ばれ、画像内の長方形領域をスライディング ウィンドウとして選択し、このウィンドウからいくつかの特徴を抽出して画像領域を記述し、最後にこれらの特徴記述に基づいてこのウィンドウが顔であるかどうかを判断します (下の図を参照)。 顔検出のプロセスは、観察する必要があるウィンドウを継続的に横断することです。 顔のキーポイント検出 これは、顔の特徴と輪郭の重要なポイントの座標を特定して返すことを指します (下の図を参照)。 重要なポイントとしては、顔、輪郭、目、眉毛、唇、鼻の輪郭などがあります。 現在、Face++ などの一部の顔認識企業は、最大 106 ポイントの高精度なキーポイントを提供できます。 静止画像でも、動的なビデオストリームでも、顔に完璧にフィットします。 顔のキーポイント位置決め技術 キーポイント位置決め技術には主にカスケード形状回帰(CSR)が含まれます。現在、顔認識は一般的にDeepIDネットワーク構造に基づいています。 DeepID ネットワーク構造は畳み込みニューラル ネットワーク構造に似ていますが、主な違いは最後から 2 番目の層です。DeepID ネットワーク構造には DeepID 層があり、これは畳み込み層 4 と最大プーリング層 3 に接続されています。畳み込みニューラル ネットワーク層の数が多いほど視野が広くなるため、この接続方法ではローカル機能とグローバル機能の両方を考慮できます (下の図を参照)。 顔認証 2 つの顔が同一人物のものである可能性を分析することを指します。 2 つの顔を入力し、信頼スコアと対応するしきい値を取得して類似性を評価します。 次の図は、Face++ 顔検証オンライン インターフェイスを呼び出した結果を示しています。比較の結果、同一人物である可能性が高いことが判明しました。 顔属性検出 顔属性認識と顔感情分析に分かれています。 たとえば、人物の年齢、ひげの有無、感情(幸せ、普通、怒り、激怒)、性別、眼鏡の有無、肌の色などを入力することで、顔の属性認識や顔の感情分析を実行できます。 以下に示す写真のテスト結果は、メイクと照明のせいであまり正確ではありません。 02. データ前処理 画像認識では、データの前処理が非常に重要なステップです。 ここでは、キャリブレーションのために facenet ソース コードの align モジュールを使用します。検出に使用するデータセットを、事前トレーニング モデルに使用するデータセットと同じサイズに調整する必要があります。 キャリブレーション プログラムを正しく実行するには、次の環境変数を設定する必要があります。
キャリブレーションコマンドは次のとおりです。
ここでは、GitHub で提供されている事前トレーニング済みモデル 20170216-091149.zip を使用し、使用するトレーニング セットは MS-Celeb-1M データセットです。 MS-Celeb-1M は、Microsoft の非常に大規模な顔認識データベースです。これは、有名人リストから上位 100 万人の有名人を選択し、検索エンジンを通じて各有名人の顔画像を約 100 枚収集することによって作成されます。この事前トレーニング済みモデルの精度は 0.993±0.004 に達しました。 ダウンロードしたモデルを次のように解凍します。
含まれるファイルは次のとおりです。
03. テストを実施する 走る facenet ディレクトリに入り、次のコマンドでスクリプトを実行します。
結果は次のとおりです。
比較する ベンチマークとの比較のために、ここでは facenet/data/pairs.txt ファイルが使用されます。これは、一致する名前と一致しない名前と画像番号を含む、ランダムに生成された公式データです。 人物名と写真番号の一致例は次のとおりです。
Abel_Pacheco の 1 枚目と 4 枚目の写真は同じ人物です。 名前と写真 ID が一致しない例には、次のようなものがあります。
つまり、Abdel_Madi_Shabneh の最初の写真と Dean_Barker の最初の写真は同一人物ではないということです。 検出 次に、validate_on_lfw.py がどのように顔を検出するかを見てみましょう。それは次の 4 つのステップに分けられます。
1. 前のpairs.txtファイルを読む 読んだ後
ファイルパスを取得し、それが一致するかどうかを確認します
2. モデルをロードする
3.入力テンソルと出力テンソルを取得する
4. フォワードプロパゲーションを使用して検証する
5. 計算 ここでは、10 倍交差検証法を使用して精度と検証率を計算します。
ここでは、アルゴリズムの精度をテストするために 10 倍のクロス検証法が使用されます。 10 分割交差検証は、一般的に使用される精度テスト方法です。具体的な戦略は、データセットを 10 の部分に分割し、そのうち 9 つをトレーニング セットとして、1 つをテスト セットとして交互に使用し、10 の結果の平均をアルゴリズムの精度の推定値として使用することです。通常、平均を計算するには、複数の 10 分割交差検証が必要です。たとえば、10 分割交差検証を 10 回実行し、平均を計算してアルゴリズムの精度の推定値として使用します。 04. AI顔認識技術は進歩している 現在、外出時にマスクを正しく着用することは必要な予防策です。 しかし、マスクは不透明なため、カメラで撮影した画像では口や鼻などの顔の特徴を捉えることができません。 顔認識モデルは顔の特徴全体を使用するため、マスクを着用すると AI 顔認識が失敗し、手動検査は非効率的になります。 幸いなことに、主要な科学技術の巨人たちは、AI 顔認識をこれまでよりもさらにスマートにする方法の研究に専念してきました。 マスク認識モデル Baiduのエンジニアが開発したAIマスク検査装置です。 公共の場で使用すると、非接触でリアルタイムの画像でマスクを着用していない人や正しく着用していない人を迅速かつ正確に識別できます。
マスク着用者の顔認識モデル SenseTimeはAIを活用した伝染病予防ソリューションを立ち上げた。 同社の地域アクセスモジュールはマスクを着用した人の身元を認識できるとしている。マスクを着用した人が鼻梁の50%が露出していれば、通過率は85%に達する。 ダイナミック顔認識 ハンワンテクノロジーは最近、ダイナミック顔認識マシンの明るいシルバーダイヤモンドモデルを発売しました。 マスク着用者の認識率も85%に達します。 現在、このシステムは北京で20人以上のユーザーと約200セットのアプリケーション機器を擁しています。
アリババやファーウェイも、認識率の高いモデルを開発している。 これまでは、顔全体の情報特徴に頼って身元を識別していました。将来的には、顔の半分、あるいは目さえも使って、AI顔認識システムが私たち一人ひとりを正確に識別できるようになります。テクノロジーが活発に発展すれば、生活の中で起こるさまざまな問題に対処するのに役立つでしょう。 AI顔認識技術についてもっと知りたいですか?この本「TensorFlow テクノロジーの分析と実践」は、すべての人にお勧めです。 TensorFlow は Google が開発したディープラーニング フレームワークであり、現在ディープラーニングの主流フレームワークの 1 つです。この本は、ディープラーニングの基礎から始まり、TensorFlow フレームワークの原理、インストール、モデル、ソースコード、統計分析など、さまざまな側面を詳しく説明します。この本は、基礎、実践、改善の 3 つの部分に分かれています。最後の付録では、参考として公開されているデータセットをいくつかリストし、著者のプロジェクト経験に基づいたプロジェクト管理に関する提案をいくつか紹介します。 |
<<: 2020年のサイバーセキュリティの転換点: 人工知能
>>: ハリー・シャムが清華大学の記録を破り、ビデオを通じて任命された史上初の教授となり、説明可能なAIを訴える
人工知能は、かなり長い間人気を博してきました。多くの投資家、起業家、そしてあらゆる規模の企業が、この...
北京時間7月27日、テスラは最近、自動車所有者に「完全自動運転」(FSD)機能のサブスクリプションを...
アンディ・ノーラン過去、生成 AI について多くの人が話し、使用し、さまざまなユースケースを試してき...
OpenAI の人事異動の影響:ウルトラマンが勝つ彼はついに株式を取得することができました!マイク...
こんにちは、最近卒業した人が ChatGPT を使用してカバーレターを作成し、数分で履歴書のスクリー...
11月2日、市場調査会社IDCが発表した最新の予測レポートによると、世界のAIソフトウェア市場規模...
最近、アメリカの一流弁護士たちが人工知能と競争したが、弁護士たちは負けたと報じられている。法律AIプ...
シリコンバレーで最も隠し切れない秘密の一つは、人工知能の専門家が実際に給料やボーナスでどれくらい稼い...
長年にわたり、クラウド コンピューティングは現代のビジネスに欠かせないツールとなり、2020 年には...
人工知能は、人間の生活に強固な物質的基盤を築くだけでなく、より多くの人々を単純で退屈な反復作業から解...
科学技術分野における人工知能技術に関する議論は最高潮に達したようだ。昨年半ば、国務院は「新世代人工知...