顔認識アルゴリズムは人間の認識能力を超えている

顔認識アルゴリズムは人間の認識能力を超えている

コンピューター科学者たちは、人間自身よりも顔を識別できる新しい顔認識アルゴリズムを開発した。

誰もが、かつて知っていた人を認識できないという経験をしたことがあるでしょう。これは、姿勢、照明、表情が変わると、実際には非常に難しいことです。コンピュータ認識システムにも同様の問題があります。実際、世界中のコンピューター科学者による長年の努力にもかかわらず、顔認識においては人間ほど強力なコンピューター認識システムはありません。

しかし、これは顔認識システムの精度が十分ではないということを意味するものではありません。逆に、最高の顔認識システムは、理想的な状況下では人間による認識よりもはるかに優れたパフォーマンスを発揮します。しかし、環境条件が悪化すると、システムのパフォーマンスは不十分になります。もちろん、コンピューター科学者は、あらゆる状況で優れたパフォーマンスを発揮するアルゴリズムを開発したいと考えています。

現在、香港大学の唐暁教授と彼の学生の陸超超(申し訳ありませんが、通訳者は学生の名前を見つけることができず、音訳することしかできませんでした)は、この問題を解決したと発表しました。彼らは、人間よりもはるかに優れた「ガウス」と呼ばれる顔認識アルゴリズムを開発しました。

新しい認識システムは、携帯電話からコンピュータ ゲームの顔認識、セキュリティ システムからパスワード制御まで、さまざまなプラットフォームで人間レベルの認識機能を提供できます。

[[112433]]

自動顔認識プログラムの場合、最初に考慮すべきことは、アルゴリズムをテストするための適切なデータセットを構築することです。そのためには、あらゆる人種、年齢、性別を考慮し、あらゆる種類の複雑な動き、照明、表情を持つさまざまな顔の非常に広範囲の画像が必要です。次に、服装、髪型、化粧などの他の要因の影響を調べる必要があります。

幸いなことに、さまざまな顔が登録された標準データベース「ラベル付き顔」がすでに存在します。ウェブ上から収集された、6,000 人以上の著名人の顔写真が 13,000 枚以上収録されています。さらに重要なのは、誰もが複数の顔写真を持っていることです。

もちろん、他の顔データベースもありますが、Labelled faces は現在、コンピューター科学者によって最も価値のあるテスト データ セットとして認識されています。

[[112434]]

顔認識のタスクは、2 つの異なる画像を比較し、それらが同一人物のものであるかどうかを判断することです。 (ここに表示されている画像のペアがそれぞれ同じ人物のものかどうかわかるかどうか試してみてください。)

このデータベースにおける人間のパフォーマンスは 97.53% の精度に達します。しかし、これまでにこの結果に匹敵するコンピューターアルゴリズムは存在しません。

この新しいアルゴリズムが登場するまでは。新しいアルゴリズムは、両目、鼻、口の角の位置という 5 つの画像特徴に基づいて、各顔画像を 150 x 120 ピクセルの画像に正規化します。

[[112435]]

次に、アルゴリズムは各画像を重複する 25 x 25 ピクセルの領域に分割し、数学的ベクトルを使用して各領域の基本的な特徴を記述します。これを実行した後、2 つの画像の類似性を比較できます。

しかし、まず何を比較するかを知る必要があります。このときにトレーニング データ セットが必要になります。一般的なアプローチは、独立したデータセットを使用してアルゴリズムをトレーニングし、次に同じデータセットの画像を使用してアルゴリズムをテストすることです。

しかし、アルゴリズムがトレーニング セット内の 2 つのまったく異なる画像に直面すると、それらを認識できないことがよくあります。 「画像の分布が変化すると、このトレーニング方法はまったく役に立たなくなります」とChaochao氏とXiaoou氏は言う。

[[112436]]

代わりに、研究者たちは、異なる画像を持つ 4 つのまったく異なるデータセットでガウスアルゴリズムをテストしました。たとえば、データセットの 1 つは有名な Multi-PIE データベースで、これには 15 種類の角度と 19 種類の照明条件で撮影された 337 個の異なるオブジェクトが 4 セットの写真に含まれています。 「Life Photes」と呼ばれる別のデータベースには、400 人の人物がそれぞれ 10 枚ずつ画像とともに含まれています。

これらのデータベースでアルゴリズムをトレーニングした後、最終的に Labelled Faces データベースで新しいアルゴリズムをテストしました。目標は、一致する画像ペアと一致しない画像ペアをすべて識別することです。

このデータベースにおける人間のパフォーマンスの精度は 97.53% であることを覚えておいてください。 「私たちの『ガウス』アルゴリズムは98.52%の精度を達成できます。これは認識アルゴリズムが人間に勝った初めてのケースです」とチャオチャオ氏とシャオウ氏は語った。

[[112437]]

データ内の写真の多様性を考慮すると、これは印象的な結果です。

Chaochao 氏と Xiaoou 氏は、彼らにはまだ多くの課題が待ち受けていると指摘した。実生活では、首や肩の位置など、さまざまな追加的な手がかりを使って識別することができます。 「超人的なパフォーマンスは象徴的な成果かもしれない」と彼らは語った。

もう 1 つの問題は、新しいアルゴリズムのトレーニングにかかる​​時間、アルゴリズムに必要なメモリの量、および 2 つの画像を認識するのにかかる時間です。これは、並列コンピューティングや専用プロセッサなどの技術を使用して、アルゴリズムの実行時間を短縮することで実現できます。

つまり、正確な自動顔認識アルゴリズムはすでに存在しており、現在の事実を考慮すると、今後はさらに高速化されるだろう。

<<:  Iconfinder が著作権侵害を排除する方法、ハッシュ アルゴリズムが画像の複製を検出

>>:  興味深い記事:女の子を追いかけるためのさまざまなアルゴリズムを教える

ブログ    
ブログ    
ブログ    

推薦する

この AI はわずか 20 分で複雑な芸術作品を作成できます。 1080グラフィックカードが実行可能

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Facebookのスマートスピーカー「フィオナ」と「アロハ」が今月下旬に発売される

Facebookは、現在FionaとAlohaというコードネームがつけられている2つのスマートスピー...

...

...

AI導入において、テクノロジーは最大の課題ではないが、人材は

[[427056]]写真: ゲッティ従来型企業の経営幹部が人工知能 (AI) や機械学習 (ML) ...

...

人工知能とロボットがすべてを変えているのでしょうか?準備はできたか?

[[227859]]ロボットはかつて、製造業の周辺に限定され、スキルや制御された動作を必要としない...

入社1年目のアルゴリズムエンジニアから新人への手紙

[[271455]]ビッグデータダイジェスト制作出典: towarddatascienceコンピレー...

人工知能のいくつかの重要な技術をご存知ですか?

今日は人工的にしか開発できない重要な技術をいくつか紹介します。音声認識からスマートホーム、人間と機械...

データが「生産手段」となるとき、透かし技術を使ってAIトレーニングデータの著作権を保護する方法をまとめた3つの論文

1. はじめに - AI トレーニング データに透かしを追加する理由ディープ ニューラル ネットワー...

...

...

分散フロー制御アルゴリズムを5分で理解する

フロー制御は、複雑なシステムでは必ず考慮しなければならない問題です。この記事では、さまざまなフロー制...

「クローズドループ」に向けての運転 | LMDrive: LLM に基づく初のクローズドループ エンドツーエンド自動運転

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...