顔認識アルゴリズムは人間の認識能力を超えている

顔認識アルゴリズムは人間の認識能力を超えている

コンピューター科学者たちは、人間自身よりも顔を識別できる新しい顔認識アルゴリズムを開発した。

誰もが、かつて知っていた人を認識できないという経験をしたことがあるでしょう。これは、姿勢、照明、表情が変わると、実際には非常に難しいことです。コンピュータ認識システムにも同様の問題があります。実際、世界中のコンピューター科学者による長年の努力にもかかわらず、顔認識においては人間ほど強力なコンピューター認識システムはありません。

しかし、これは顔認識システムの精度が十分ではないということを意味するものではありません。逆に、最高の顔認識システムは、理想的な状況下では人間による認識よりもはるかに優れたパフォーマンスを発揮します。しかし、環境条件が悪化すると、システムのパフォーマンスは不十分になります。もちろん、コンピューター科学者は、あらゆる状況で優れたパフォーマンスを発揮するアルゴリズムを開発したいと考えています。

現在、香港大学の唐暁教授と彼の学生の陸超超(申し訳ありませんが、通訳者は学生の名前を見つけることができず、音訳することしかできませんでした)は、この問題を解決したと発表しました。彼らは、人間よりもはるかに優れた「ガウス」と呼ばれる顔認識アルゴリズムを開発しました。

新しい認識システムは、携帯電話からコンピュータ ゲームの顔認識、セキュリティ システムからパスワード制御まで、さまざまなプラットフォームで人間レベルの認識機能を提供できます。

[[112433]]

自動顔認識プログラムの場合、最初に考慮すべきことは、アルゴリズムをテストするための適切なデータセットを構築することです。そのためには、あらゆる人種、年齢、性別を考慮し、あらゆる種類の複雑な動き、照明、表情を持つさまざまな顔の非常に広範囲の画像が必要です。次に、服装、髪型、化粧などの他の要因の影響を調べる必要があります。

幸いなことに、さまざまな顔が登録された標準データベース「ラベル付き顔」がすでに存在します。ウェブ上から収集された、6,000 人以上の著名人の顔写真が 13,000 枚以上収録されています。さらに重要なのは、誰もが複数の顔写真を持っていることです。

もちろん、他の顔データベースもありますが、Labelled faces は現在、コンピューター科学者によって最も価値のあるテスト データ セットとして認識されています。

[[112434]]

顔認識のタスクは、2 つの異なる画像を比較し、それらが同一人物のものであるかどうかを判断することです。 (ここに表示されている画像のペアがそれぞれ同じ人物のものかどうかわかるかどうか試してみてください。)

このデータベースにおける人間のパフォーマンスは 97.53% の精度に達します。しかし、これまでにこの結果に匹敵するコンピューターアルゴリズムは存在しません。

この新しいアルゴリズムが登場するまでは。新しいアルゴリズムは、両目、鼻、口の角の位置という 5 つの画像特徴に基づいて、各顔画像を 150 x 120 ピクセルの画像に正規化します。

[[112435]]

次に、アルゴリズムは各画像を重複する 25 x 25 ピクセルの領域に分割し、数学的ベクトルを使用して各領域の基本的な特徴を記述します。これを実行した後、2 つの画像の類似性を比較できます。

しかし、まず何を比較するかを知る必要があります。このときにトレーニング データ セットが必要になります。一般的なアプローチは、独立したデータセットを使用してアルゴリズムをトレーニングし、次に同じデータセットの画像を使用してアルゴリズムをテストすることです。

しかし、アルゴリズムがトレーニング セット内の 2 つのまったく異なる画像に直面すると、それらを認識できないことがよくあります。 「画像の分布が変化すると、このトレーニング方法はまったく役に立たなくなります」とChaochao氏とXiaoou氏は言う。

[[112436]]

代わりに、研究者たちは、異なる画像を持つ 4 つのまったく異なるデータセットでガウスアルゴリズムをテストしました。たとえば、データセットの 1 つは有名な Multi-PIE データベースで、これには 15 種類の角度と 19 種類の照明条件で撮影された 337 個の異なるオブジェクトが 4 セットの写真に含まれています。 「Life Photes」と呼ばれる別のデータベースには、400 人の人物がそれぞれ 10 枚ずつ画像とともに含まれています。

これらのデータベースでアルゴリズムをトレーニングした後、最終的に Labelled Faces データベースで新しいアルゴリズムをテストしました。目標は、一致する画像ペアと一致しない画像ペアをすべて識別することです。

このデータベースにおける人間のパフォーマンスの精度は 97.53% であることを覚えておいてください。 「私たちの『ガウス』アルゴリズムは98.52%の精度を達成できます。これは認識アルゴリズムが人間に勝った初めてのケースです」とチャオチャオ氏とシャオウ氏は語った。

[[112437]]

データ内の写真の多様性を考慮すると、これは印象的な結果です。

Chaochao 氏と Xiaoou 氏は、彼らにはまだ多くの課題が待ち受けていると指摘した。実生活では、首や肩の位置など、さまざまな追加的な手がかりを使って識別することができます。 「超人的なパフォーマンスは象徴的な成果かもしれない」と彼らは語った。

もう 1 つの問題は、新しいアルゴリズムのトレーニングにかかる​​時間、アルゴリズムに必要なメモリの量、および 2 つの画像を認識するのにかかる時間です。これは、並列コンピューティングや専用プロセッサなどの技術を使用して、アルゴリズムの実行時間を短縮することで実現できます。

つまり、正確な自動顔認識アルゴリズムはすでに存在しており、現在の事実を考慮すると、今後はさらに高速化されるだろう。

<<:  Iconfinder が著作権侵害を排除する方法、ハッシュ アルゴリズムが画像の複製を検出

>>:  興味深い記事:女の子を追いかけるためのさまざまなアルゴリズムを教える

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

人工知能をより深く理解するための人工知能と機械学習の12のキーワード

[[260979]]人工知能(AI)技術があらゆる分野にますます大きな影響を及ぼすようになるにつれ、...

5G時代には人工知能が人を殺し始めるのでしょうか?

映画やテレビ作品では、人工知能による殺人はごく普通のことのように思えますが、結局のところ、それは人間...

科学者たちは、人間の肌の感触を模倣し、さらには触覚の方向を感知して予測できる電子毛髪を備えたロボットを開発している。

ビッグデータダイジェスト制作著者: カレブ皆さんはたくさんのロボットを見たことがあると思いますが、こ...

スマートカーの時代において、あなたの安全とプライバシーを誰が保証するのでしょうか?

電気スマートカーの発展により、自動車はもはや独立した機械的なハードウェアボックスではなく、センシング...

自動運転高速道路の技術仕様の導入によってメリットを享受できる分野はどこでしょうか?

自動運転車を大規模に公道に導入するには、車自体が技術基準を満たしていることを確認するだけでは十分では...

わずか4つの例から、DeepMindの800億のモデルは本当に学習した

知能の鍵となるのは、簡単な指示を与えられて新しいタスクを実行する方法を素早く学習する能力です。たとえ...

PytorchのNNモジュールと最初のニューラルネットワークモデルを実装する

PyTorch でモデルを構築します (主に NN モジュール)。 nn.リニアnn.Linear ...

インテリジェントな音声対話サービスはますます良くなり、従順であることも芸術である

スマートスピーカー、スマートフォン、スマートブレスレット、スマートエアコンなどのデバイスを購入するこ...

AIから本当に恩恵を受けるのは誰でしょうか?

人工知能の可能性は計り知れないものの、この技術革命から誰が最も恩恵を受けるのかについては議論が続いて...

AI医薬品製造はここにあります!新薬開発は「10年間の努力」に別れを告げるかもしれない

[[385336]] AI顔認識技術は人気歌手のコンサートから逃亡した犯人を捕まえるのに役立ち、AI...

AIはデジタル変革の失敗から学ぶ必要がある

1 月に IBM は、デジタル トランスフォーメーションが予測された 150% ではなく -5% ~...

人工知能と機械学習の違いを本当に理解していますか?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

マイクロソフト、医療病理学の症例を分析する LLaVA-Med AI モデルを発表

6月14日、マイクロソフトの研究者らは、主に生物医学研究に使用され、CTやX線画像に基づいて患者の病...

Belcorp CIO: AI による IT 研究開発の見直し

多国籍美容企業ベルコープは過去3年間、パンデミック、消費者行動の変化、サプライチェーンの混乱、インフ...