顔認識アルゴリズムは人間の認識能力を超えている

顔認識アルゴリズムは人間の認識能力を超えている

コンピューター科学者たちは、人間自身よりも顔を識別できる新しい顔認識アルゴリズムを開発した。

誰もが、かつて知っていた人を認識できないという経験をしたことがあるでしょう。これは、姿勢、照明、表情が変わると、実際には非常に難しいことです。コンピュータ認識システムにも同様の問題があります。実際、世界中のコンピューター科学者による長年の努力にもかかわらず、顔認識においては人間ほど強力なコンピューター認識システムはありません。

しかし、これは顔認識システムの精度が十分ではないということを意味するものではありません。逆に、最高の顔認識システムは、理想的な状況下では人間による認識よりもはるかに優れたパフォーマンスを発揮します。しかし、環境条件が悪化すると、システムのパフォーマンスは不十分になります。もちろん、コンピューター科学者は、あらゆる状況で優れたパフォーマンスを発揮するアルゴリズムを開発したいと考えています。

現在、香港大学の唐暁教授と彼の学生の陸超超(申し訳ありませんが、通訳者は学生の名前を見つけることができず、音訳することしかできませんでした)は、この問題を解決したと発表しました。彼らは、人間よりもはるかに優れた「ガウス」と呼ばれる顔認識アルゴリズムを開発しました。

新しい認識システムは、携帯電話からコンピュータ ゲームの顔認識、セキュリティ システムからパスワード制御まで、さまざまなプラットフォームで人間レベルの認識機能を提供できます。

[[112433]]

自動顔認識プログラムの場合、最初に考慮すべきことは、アルゴリズムをテストするための適切なデータセットを構築することです。そのためには、あらゆる人種、年齢、性別を考慮し、あらゆる種類の複雑な動き、照明、表情を持つさまざまな顔の非常に広範囲の画像が必要です。次に、服装、髪型、化粧などの他の要因の影響を調べる必要があります。

幸いなことに、さまざまな顔が登録された標準データベース「ラベル付き顔」がすでに存在します。ウェブ上から収集された、6,000 人以上の著名人の顔写真が 13,000 枚以上収録されています。さらに重要なのは、誰もが複数の顔写真を持っていることです。

もちろん、他の顔データベースもありますが、Labelled faces は現在、コンピューター科学者によって最も価値のあるテスト データ セットとして認識されています。

[[112434]]

顔認識のタスクは、2 つの異なる画像を比較し、それらが同一人物のものであるかどうかを判断することです。 (ここに表示されている画像のペアがそれぞれ同じ人物のものかどうかわかるかどうか試してみてください。)

このデータベースにおける人間のパフォーマンスは 97.53% の精度に達します。しかし、これまでにこの結果に匹敵するコンピューターアルゴリズムは存在しません。

この新しいアルゴリズムが登場するまでは。新しいアルゴリズムは、両目、鼻、口の角の位置という 5 つの画像特徴に基づいて、各顔画像を 150 x 120 ピクセルの画像に正規化します。

[[112435]]

次に、アルゴリズムは各画像を重複する 25 x 25 ピクセルの領域に分割し、数学的ベクトルを使用して各領域の基本的な特徴を記述します。これを実行した後、2 つの画像の類似性を比較できます。

しかし、まず何を比較するかを知る必要があります。このときにトレーニング データ セットが必要になります。一般的なアプローチは、独立したデータセットを使用してアルゴリズムをトレーニングし、次に同じデータセットの画像を使用してアルゴリズムをテストすることです。

しかし、アルゴリズムがトレーニング セット内の 2 つのまったく異なる画像に直面すると、それらを認識できないことがよくあります。 「画像の分布が変化すると、このトレーニング方法はまったく役に立たなくなります」とChaochao氏とXiaoou氏は言う。

[[112436]]

代わりに、研究者たちは、異なる画像を持つ 4 つのまったく異なるデータセットでガウスアルゴリズムをテストしました。たとえば、データセットの 1 つは有名な Multi-PIE データベースで、これには 15 種類の角度と 19 種類の照明条件で撮影された 337 個の異なるオブジェクトが 4 セットの写真に含まれています。 「Life Photes」と呼ばれる別のデータベースには、400 人の人物がそれぞれ 10 枚ずつ画像とともに含まれています。

これらのデータベースでアルゴリズムをトレーニングした後、最終的に Labelled Faces データベースで新しいアルゴリズムをテストしました。目標は、一致する画像ペアと一致しない画像ペアをすべて識別することです。

このデータベースにおける人間のパフォーマンスの精度は 97.53% であることを覚えておいてください。 「私たちの『ガウス』アルゴリズムは98.52%の精度を達成できます。これは認識アルゴリズムが人間に勝った初めてのケースです」とチャオチャオ氏とシャオウ氏は語った。

[[112437]]

データ内の写真の多様性を考慮すると、これは印象的な結果です。

Chaochao 氏と Xiaoou 氏は、彼らにはまだ多くの課題が待ち受けていると指摘した。実生活では、首や肩の位置など、さまざまな追加的な手がかりを使って識別することができます。 「超人的なパフォーマンスは象徴的な成果かもしれない」と彼らは語った。

もう 1 つの問題は、新しいアルゴリズムのトレーニングにかかる​​時間、アルゴリズムに必要なメモリの量、および 2 つの画像を認識するのにかかる時間です。これは、並列コンピューティングや専用プロセッサなどの技術を使用して、アルゴリズムの実行時間を短縮することで実現できます。

つまり、正確な自動顔認識アルゴリズムはすでに存在しており、現在の事実を考慮すると、今後はさらに高速化されるだろう。

<<:  Iconfinder が著作権侵害を排除する方法、ハッシュ アルゴリズムが画像の複製を検出

>>:  興味深い記事:女の子を追いかけるためのさまざまなアルゴリズムを教える

ブログ    
ブログ    

推薦する

...

AIがサイバーセキュリティに革命を起こす: フィッシング攻撃の防止

テクノロジーが私たちの日常生活を支配する時代において、サイバー脅威はますます巧妙かつ危険なものになっ...

マスク氏はテスラの完全自動運転が今年中に利用可能になると予測するが、AIの大きな変化を懸念している

同氏は、テスラは人間の介入なしの完全自動運転の実現に近づいていると述べ、完全自動運転の実用性と自動車...

2020年に注目を集めるグラフ機械学習の研究動向とは?

[[314165]]この記事はLeiphone.comから転載したものです。転載する場合は、Lei...

機械学習の基礎チャート: 概念、原則、歴史、トレンド、アルゴリズム

1. 機械学習の概要1. 機械学習とは何ですか?機械は大量のデータを分析して学習します。たとえば、猫...

Tongji と Alibaba は CVPR 2022 最優秀学生論文賞のためにどのような研究を行いましたか?これは、

この記事では、CVPR 2022 最優秀学生論文賞を受賞した私たちの研究「EPro-PnP: 単眼物...

掃除ロボットはほこりを吸い取るだけでなく、プライバシーも「吸い取る」ことができます

家庭でますます一般的になりつつある掃除ロボットは、ほこりを吸い取るだけでなく、個人のプライバシーも「...

人間同士のやりとりを人工知能に置き換える時期が来ているのでしょうか?

人工知能 (AI) は、面倒で時間のかかるすべての手動プロセスを置き換え、人間が価値の高いタスクに集...

機械学習の発展が吹き替え技術の向上にどのように役立つか

翻訳者 | 李睿校正 | 梁哲、孫淑娟人工知能 (AI) テクノロジーはここ数年で急速に発展し、ビジ...

...

...

...

機械学習モデルに不可欠な 5 つのデータ前処理手法

[[324419]]データ サイエンス プロジェクトに取り組んだことがある場合、データ マイニングの...

Adobeは、より高品質な画像を提供するために、AI生成モデルの新世代であるFirefly Image 2をリリースしました。

アドビは10月11日、先日開催されたAdobe MAXクリエイティブカンファレンスにおいて、同社のA...