顔認証ロック解除を使用するとき、携帯電話はどのようにしてあなたを「認識」するのでしょうか?顔認識について詳しく知る

顔認証ロック解除を使用するとき、携帯電話はどのようにしてあなたを「認識」するのでしょうか?顔認識について詳しく知る

2020年10月1日、私たちの祖国は71歳の誕生日を迎えました!

我が国は、最初の人工衛星の打ち上げから北斗システムのネットワーク化の成功まで、最初のハイブリッド米の栽培から農村地域におけるスマート農業の普及まで、最初の高速列車の出発から全国を走る高速鉄道の路線まで、過去71年間に世界に名だたる科学技術の成果を次々と達成してきました。あらゆる面で小康社会を築くという新しい時代において、科学技術は人々の生活とより密接に結びつき、科学技術産業は新たな使命を与えられています。

顔認識と人工知能の関係を理解し​​ていただきます〜

[[380242]]

「顔認証」は近年話題になっており、実生活のあらゆるところで目にすることができます。例えば、スマートフォンの顔認証ロック解除は高速かつ正確です。モバイル決済の「顔認証決済」は安全かつ便利です。住宅街での顔認証による入退室管理は鍵を忘れる手間を省きます。

さらに、携帯電話のスマートアルバムは、写真に写っている人物に応じて写真を自動的に分類することができ、美容カメラの特殊効果機能は、ユーザーが興味を持っている美容効果を提供することができます...

では、顔認識は技術的にはどのように実現されるのでしょうか?人工知能とどう関係するのでしょうか?

顔認識の誕生

顔認識技術は 1960 年代に始まり、1990 年代後半に応用段階に入り、現在では比較的成熟した技術となっています。顔認識アルゴリズムの基本的な考え方は、人物の「顔の特徴」を捉え、比較・分析することで人物を識別することです。

ある人のことを思い出したいとき、私たちはまず、その人のまぶたが二重かどうか、目の色は何色か、髪はカールしているかストレートか、鼻梁はどのくらい高いか、などを思い出すかもしれません。これらはいわゆる「顔の特徴」です。

しかし、非常によく似た 2 人の人物 (双子など) を肉眼で見分けるのは困難です。コンピューター支援による顔認識技術は、2 人の類似点と相違点を正確かつ迅速に識別できます。これは、顔認識アルゴリズムが、肉眼で観察できるよりもはるかに多くの「顔の特徴」を識別して記憶し、人々のより微妙な違いを捉えることができるためです。

顔認識とは、カメラやビデオカメラを使用して、人間の顔の特徴に基づいて顔を含む写真(またはビデオ)を取得し、写真(またはビデオ)内の顔を自動的に検出して追跡し、収集した顔に対して顔認識を実行する一連の方法です。

顔認識のプロセスは通常、顔検出、顔の位置合わせ、顔のエンコード、顔のマッチングの 4 つのステップに分かれています。

最初のステップは顔検出です。当然ですが、顔を区別する前に、まず写真の中で顔の位置を特定する必要があります。たとえば、市販の携帯電話で写真を撮ると、携帯電話が自動的に人の顔を四角でマークできることがわかります。これが顔検出技術の使用です。

[[380245]]

2 番目のステップは、顔の位置合わせです。写真内の顔の位置を検出した後、よく直面する問題は、写真内の顔が傾いていたり、横顔だけだったりすることです。

人間は、2 つの異なる方向を向いているときに同じ顔を簡単に認識できますが、コンピューターはそれを 2 つのまったく異なる ID として認識することがよくあります。

したがって、顔の位置合わせを完了するには、顔の特徴(目、鼻、口など)を見つけて、幾何学的変換(回転、拡大縮小など)を通じてこれらの特徴を対応する位置に移動する必要があります。

[[380247]]

3番目のステップは顔のエンコードです。最も直接的なアプローチは、検出して位置合わせした未知の顔を、すでにラベル付けした顔画像と比較することです。未知の顔が以前に注釈が付けられた顔と非常に似ている場合、同一人物である可能性が非常に高くなります。

しかし、この方法では、短時間で大量の写真の顔を認識することはできません。そのため、プログラマーが人工知能技術を使用してコンピューター内のニューラルネットワークをトレーニングし、同じ人物の2つの異なる顔写真と別の人物の顔写真を同時にコンピューター内のニューラルネットワークに入力して判断させ、このプロセスを継続的に繰り返す必要があります。

継続的なトレーニングプロセス中に、プログラマーは入力された同一人物の 2 枚の写真の違いを減らし、コンピューターがその人物の顔の特徴を学習できるようにします。

実際の認識では、事前にすべての人の顔画像を顔データベースに登録し、機械学習の比較方法(KNN分類器など)を使用して、見つけたい顔と顔データベースのデータを比較します。

4番目のステップは顔の照合です。これは最後のステップであり、最も簡単なステップでもあります。最初の 3 つのステップを終えると、コンピューターは私たちと同じように多くの人の顔の特徴を記憶します。顔照合技術を使用することで、コンピューターは写真ライブラリから対象人物に最も類似した写真を自動的に見つけることができます。

[[380249]]

人工知能と顔認識にはどのような関係があるのでしょうか?

人工知能には、インターネット、ビッグデータ、自然言語処理、コンピュータービジョンなど、多くの分野が関係しています。
その中でも、コンピュータービジョンは人間の活動に最も関連のある分野として、人工知能開発の全過程において極めて重要な位置を占めています。顔認識技術は、コンピュータービジョンの分野で長い間開発されてきた非常に成熟した技術です。人工知能とは何かを簡単に見てみましょう。
人工知能は、主にコンピュータプログラムを使用して人間の知能技術を提示する方法を研究し、さまざまな自動化機械または知能機械(主にコンピュータ)が人間の知能を学習、模倣、拡張、拡大できるようにすることを目的としています。

人工知能の学習プロセスは、私たちが幼い頃に両親が物体の認識を教えたときのプロセスに似ています。両親は子犬を指差して、それが犬だと教えてくれました。何度か注意深く教えられた後、私たちは、コミュニティ全体にいる毛むくじゃらで震えながら速く走る四足動物はすべて「犬」と呼ばれていることを知りました(ハスキー犬、テディ、または中国原産の犬であっても)。

プログラマーが何千枚もの犬の写真をコンピューターに入力することで、人工知能は物体を認識することを学習し、コンピューターはさまざまな犬の特徴(2つの目、4本の足、ふわふわの毛など)を認識し、人工知能ニューラルネットワークを構築できるようになります。次に、2 つの目と 4 本の足と毛皮を持つ、毛むくじゃらの生き物の写真を入力すると、コンピューターはそれが子犬であることを自然に認識します。

[[380250]]

2010年、人工知能技術が画像認識の分野に参入し始め、カメラを使った顔認識が現実のものとなりました。たとえば、公安部門はカメラを使用して顔認識を実行できます (カメラの顔が横顔、遮られた顔、暗い場所、ぼやけているかどうかに関係なく、今日の人工知能技術ではミリ秒レベルの検出を実現できます)。

さらに、人工知能技術を利用して監視画像を分析し、群衆の数、密度、性別、服装の特徴などをリアルタイムでマークすることもできます。他の国と比べて、私の国は膨大な顔のビッグデータリソースを持っています。人工知能をベースにした顔認識技術は、私たちの生活のあらゆる場面に応用されています。

人工知能は私たちにどのような影響を与えるのでしょうか?

現在、人工知能技術は私たちの生活に全面的に浸透し、スマートライフへの扉が開かれています。

顔認識に加えて、スマート医療の分野では、スマートロボットが医師の患者の診断と治療を支援しています。スマート交通の分野では、無人運転車が走行し始めています。スマートホームの分野では、さまざまなインタラクティブなスマートハードウェアが増加しています。スマート金融の分野では、人工知能がプロのファイナンシャルアドバイザーに取って代わり、顧客に完璧な金融ソリューションを提供できます...

[[380251]]

人工知能技術は私たちの生活に便利さをもたらしますが、潜在的な問題や限界もあります。

一方、人工知能技術はビッグデータに基づいており、個人情報の収集と処理を伴うため、必然的に個人のプライバシーの問題を避けることはできません。これには、管理機関が標準化されたデータ管理システムまたは対策を策定することが必要になります。

一方、人工知能自体には一定の技術的限界があり、すべての問題が人工知能によって解決できるわけではありません。

[[380252]]

技術の向上と進歩により、人工知能技術は将来ますます成熟し、人類にさらに大きな利益をもたらすと信じています。

<<:  映画に騙されないでください。人工知能はどうやって人間を殺すのでしょうか?

>>:  DeepGlint: 顔認識の最新の進歩と産業グレードの大規模な顔認識の実践に関する議論

ブログ    

推薦する

テレンス・タオが AI を使って形式化した証明とは、いったい何でしょうか? PFR予想の歴史の簡単な紹介

12月5日、有名な数学者でフィールズ賞受賞者のテレンス・タオ氏は、ソーシャルネットワーク上で、多項式...

LexisNexisが生成AIの課題に挑む

生成型 AI の破壊的な脅威から抜け出す方法を模索している IT リーダーは、LexisNexis ...

xAI Twitterライブ放送:GoogleやOpenAIと直接競合する

人工知能の波に直面して、マスク氏はついに再び行動を起こした! 7月15日、マスク氏とxAI創設チーム...

...

人生の意味とは何でしょうか?ステーションBのUP司会者がAIに「究極の質問」を投げかけた

人生の意味とは何でしょうか?人はなぜ生きるのか?これらの「宇宙の究極の疑問」は、歴史を通じて数え切れ...

...

AI、IoT、5Gの先進技術の背後にあるもの

代償なくして勝利はない。しかし、私たちはしばしばこのことを忘れ、即座の勝利を要求します。これは、世界...

Amazon Transcribe について

Amazon Transcribe は、開発者がアプリケーションに音声テキスト変換機能を簡単に追加で...

Midjourney 5.2 がリリースされました!オリジナルの絵画から3Dシーンを生成し、無限の宇宙を無限に拡大します

旅の途中と安定した拡散が限界に達しました! Stable Diffusion XL 0.9 がリリー...

LEACHプロトコルのアルゴリズムと特徴

LEACH プロトコルについてはあまり知られていないかもしれません。このプロトコルの説明は、低電力適...

RNN の理論から PyTorch まで

RNN とは何か、どこで使用されているか、どのように前方および後方に伝播するか、そして PyTorc...

...

囲碁AIの不正行為の最初の事例はすでに発生しています。他の事例は後れを取っているのでしょうか?

[[227817]]画像出典: Visual Chinaカンニングは間違いなく長い歴史を持つ「科学...

AI、機械学習、ディープラーニングの違いは何ですか?

人工知能 (AI) は未来だと言う人もいれば、AI は SF だと言う人もいれば、AI は私たちの日...