顔認識はどのように実現されるのでしょうか? コンピューターはカメラを通じてどのように私たちの身元を識別するのでしょうか?

顔認識はどのように実現されるのでしょうか? コンピューターはカメラを通じてどのように私たちの身元を識別するのでしょうか?

携帯電話を使って顔をスキャンして支払いをするとき、会社の入退室管理を通過するとき、あるいは道路を運転しているとき、どこにでもある顔認識システムがどのように私たちの身元を認識しているか考えたことがありますか?

[[422726]]

2015年3月15日、ハノーバーITエキスポで、アリババ創業者のジャック・マー氏は顔認識技術を使って支払いを行い、メルケル首相に1948年のハノーバー記念切手を贈呈した。

それで彼はどのように働くのですか?

顔を認識するために、コンピューターは最初にログインしたときに各人の写真を保存するデータベースを構築します。コンピューターは最初に顔テンプレートを使用して画像データ内を上下左右に移動して計算します。計算結果に応じて、写真内の顔の位置とサイズがロックされ、写真内の顔がキャプチャされ、サイズが標準状態に調整されます。コンピューターは、現在見ている顔をデータベース内の何千もの顔と比較する必要があります。顔のマッチングをうまく行うために、研究者はさまざまな方法を考えました。

[[422727]]

1. 参照テンプレート方式

まず、1 つ以上の標準顔テンプレートを設計し、テスト用に収集したサンプルと標準テンプレートの一致度を計算し、しきい値を使用して顔があるかどうかを判断します。

[[422728]]

2. フェイスルール法

コンピューターはまず、あらかじめ保存されている顔の目、鼻、口の位置情報を計算します。比較の際には、写真の両目の距離、鼻や口の大きさなどを計測し、写真がデータベース内の人物の顔情報と一致するかどうかを比較します。

[[422729]]

3. 学習方法の例

この方法は、パターン認識における人工ニューラル ネットワーク方式を使用して、顔サンプル セットと非顔サンプル セットを学習して分類器を生成します。

[[422730]]

4. 肌色モデル法

この方法は、色空間における顔の肌の色の比較的集中した分布に基づいて検出を実行します。

5. 固有面法

より正確な方法としては、コンピュータがデータベース内の大量の顔データを組み合わせて、数十の特徴的な顔を計算します。実際の顔はそれぞれ、これらの特徴的な顔の割合で構成できます。2 つの顔に含まれるさまざまな特徴的な顔の割合が非常に近い限り、同一人物であると判断できます。

もちろん、コンピュータが顔を認識できないこともあります。顔認識の難しさは、主に顔が生物学的特徴であるという特性によるものです。個人差はあまりありません。人間の顔の構造はどれも似ており、顔の器官の構造や外観も非常に似ています。このような特徴は、顔を使って位置決めをするのには有利ですが、顔を使って人間同士を区別するのには不利です。

[[422731]]

人間の顔の形は非常に不安定であるため、顔の変化によってさまざまな表情を作り出すことができ、観察角度によって顔の視覚イメージが大きく変化します。

[[422732]]

写真に写っている人物がマスクやサングラスをかけていたり、顔の半分しか写っていなかったり、光が暗すぎたり明るすぎたりすると、顔認識システムで識別するのが難しくなる可能性がある。コンピューターの精度を高めるために、科学者たちはまだやるべきことがたくさんある。

<<:  英国を拠点とするサマドは、eVTOL飛行試験と新型貨物ドローンの開発を進めている。

>>:  テンセントは大人のプレイヤーから厳しい批判を受けた!実名認証だけでは不十分、顔認証も必要

ブログ    
ブログ    
ブログ    

推薦する

機械学習の応用シナリオは数多くありますが、金融分野での違いは何でしょうか?

[[241804]]ビッグデータダイジェスト制作編纂者:大迪、彭耀慧、茶曦、唐元、夏亜偉金融の世界...

完全なルーティングアルゴリズムの設計目標の分析

ルーティング アルゴリズムには通常、次の 1 つ以上の設計目標があります。最適化:最適化とは、メトリ...

ディープラーニングの仕組み: 今日の AI を支えるニューラル ネットワークの内部を覗いてみよう

[[428985]] [51CTO.com クイック翻訳]今日の人工知能の繁栄は、人工ニューラルネッ...

...

...

GPT-4 がビッグモデル幻覚ランキングで優勝、NVIDIA の科学者が偽物と激しく戦う! ChatGPTのメタ版作者が抗議のため長文の記事を投稿

大型モデルにおける幻覚の問題は、業界ではよく話題になります。最近、Vectara という組織が Gi...

...

...

バックドアの王: 暗号化アルゴリズムにおける数学的バックドアについて語る

政府や諜報機関は、データや通信の暗号化保護を制御または回避しようとしており、暗号化アルゴリズムにバッ...

画像からの「テキスト生成」の難しさを克服し、同レベルの拡散モデルを粉砕せよ! TextDiffuser アーキテクチャの 2 世代の詳細な分析

近年、テキスト生成画像、特に詳細レベルでリアルな効果を示す拡散ベースの画像生成モデルの分野で大きな進...

IDC FutureScape: 人工知能がIT業界とビジネス運営を変革する

IDC は、2024 年以降の世界の情報技術業界の予測である FutureScape レポートを発表...

機械翻訳から読心術まで、AIは人類のバベルの塔を再建できるのか?

聖書の旧約聖書創世記には、人類が団結して天国に通じるバベルの塔を建てたという話があります。この計画を...

NASAのジェット推進研究所が人工知能に取り組んでいる様子をご覧ください

[51CTO.com クイック翻訳] ジェット推進研究所 (JPL) では、同僚がインテリジェントな...

AIがマーケティングオーディエンスの洞察をどのように変えるのか

[[429813]]人工知能は、企業のマーケティング範囲の拡大に大きく貢献することが証明されています...

OpenAI CEO: GPT-4 は週当たり 1 億人のアクティブ ユーザーを抱え、依然として世界で最も強力な AI モデルです

米国現地時間11月7日月曜日に開催された第1回OpenAI開発者会議で、同社CEOのサム・アルトマン...