虐殺後に行方不明になった親族をAIで探す! Googleのエンジニアが第二次世界大戦の70万枚以上の古い写真を識別できる顔認識プログラムを開発

虐殺後に行方不明になった親族をAIで探す! Googleのエンジニアが第二次世界大戦の70万枚以上の古い写真を識別できる顔認識プログラムを開発

AI顔認識の分野で新たなビジネスが開拓されているのでしょうか?

今回の課題は、第二次世界大戦の古い写真に写っている顔画像を識別することです。

最近、グーグルのソフトウェアエンジニアであるダニエル・パット氏は、第二次世界大戦やホロコースト以前のヨーロッパの写真を認識し、現代の人々と結び付けることができるN2N(Numbers to Names)と呼ばれるAI顔認識技術を開発した。

AIを使って行方不明の親戚を探す

2016年、パットさんはワルシャワのポーランド系ユダヤ人記念碑を訪れていたとき、あるアイデアを思いつきました。

これらの奇妙な顔は私と血縁関係があるのでしょうか?

彼の祖父母のうち3人はポーランド出身のホロコースト生存者であり、彼は祖母がナチスに殺害された家族の写真を見つけるのを手伝いたいと考えていた。

第二次世界大戦中、ポーランドのユダヤ人の数が多かったため、その多くがさまざまな強制収容所に収監され、その行方は不明でした。

黄ばんだ写真だけでは、行方不明の親戚を見つけるどころか、顔を特定するのも困難です。

そこで彼は家に帰り、すぐにこのアイデアを現実のものにしたのです。

このソフトウェアの当初のアイデアは、データベースを通じて顔画像情報を収集し、人工知能アルゴリズムを使用して、類似度が最も高い上位 10 個のオプションを一致させることでした。

画像データの大部分は米国ホロコースト記念博物館から提供されており、全国のデータベースから収集された100万枚以上の画像が含まれています。

ユーザーはコンピューター ファイルから画像を選択し、アップロードをクリックするだけで、システムによって最も一致する画像を含む上位 10 個のオプションが自動的にフィルタリングされます。

さらに、ユーザーはソースアドレスをクリックして、画像の年、場所、美術館などの情報を表示することもできます。

問題の一つは、現代の人物の画像を入力すると、検索結果もとんでもないものになる可能性があることです。

これが結果ですか? (黒い疑問符)

つまり、システム機能の改善が必要です。

Patt は、Google の他のソフトウェア エンジニアやデータ サイエンティストのチームとも協力して、検索の範囲と精度の向上に取り組んでいます。

顔認識システムはプライバシー漏洩のリスクがあるため、パット氏は「当社は本人確認は行いません。類似度スコアを付した結果を提示し、ユーザーが自分で判断できるようにすることだけが当社の責任です」と述べた。

AI顔認識技術の開発

では、この技術はどうやって顔を認識するのでしょうか?

当初、顔認識技術は「検出された画像が顔であるかどうかをどうやって判定するか」というところからスタートしなければなりませんでした。

2001 年、コンピューター ビジョン研究者のポール ビオラとマイケル ジョーンズは、高精度でリアルタイムに顔を検出するフレームワークを提案しました。

このフレームワークは、トレーニング モデルに基づいて「何が顔で、何が顔でないか」を理解できます。

トレーニングが完了すると、モデルは特定の特徴を抽出し、それをファイルに保存して、新しい画像の特徴をさまざまな段階で以前に保存された特徴と比較できるようになります。

精度を確保するには、アルゴリズムを「数十万枚の正画像と負画像を含む大規模なデータセット」でトレーニングする必要があり、これにより、画像内に顔があるかどうか、またその位置を判定するアルゴリズムの能力が向上する。

調査中の画像が特徴比較の各段階を通過すると、顔が検出され、操作を続行できます。

Viola-Jones フレームワークは、リアルタイム アプリケーションで高精度に顔を認識するために使用できますが、一定の制限があります。

たとえば、顔がマスクを着用している場合や、顔の向きが正しくない場合、フレームワークが機能しない可能性があります。

Viola-Jones フレームワークの欠点を解決し、顔検出を改善するために、彼らは他のアルゴリズムを開発しました。

プロセスの改善に役立つ、領域ベースの畳み込みニューラル ネットワーク (R-CNN) やシングル ショット検出器 (SSD) など。

畳み込みニューラル ネットワーク (CNN) は、画像認識と処理に使用される人工ニューラル ネットワークであり、特にピクセル データを処理するために設計されています。

R-CNN は、CNN フレームワーク上で領域提案を生成し、画像内のオブジェクトを特定して分類します。

R-CNN などの領域提案ネットワーク ベースの方法では、領域提案を生成するためのショットと、各提案内のオブジェクトを検出するためのショットの 2 つが必要ですが、SSD では、画像内の複数のオブジェクトを検出するのに 1 つのショットのみが必要です。したがって、SSD は R-CNN よりも大幅に高速です。

近年、ディープラーニング モデルを活用した顔認識技術は、従来のコンピューター ビジョン手法を大幅に上回る性能を発揮しています。

初期の顔認識では主に従来の機械学習アルゴリズムが使用されており、研究ではより識別力の高い特徴を抽出する方法や顔をより効果的に整列させる方法に重点が置かれていました。

研究が深まるにつれ、2次元画像での顔認識における従来の機械学習アルゴリズムの性能向上は徐々にボトルネックになってきました。

人々はビデオの顔認識の問題に目を向け始め、または3次元モデル手法を組み合わせて顔認識のパフォーマンスをさらに向上させ始め、一部の学者は3次元顔認識の問題を研究し始めました。

最も有名なLFW公共図書館では、ディープラーニングアルゴリズムが2次元画像での顔認識性能における従来の機械学習アルゴリズムのボトルネックを突破し、初めて認識率を97%以上に向上させました。

つまり、「CNNネットワークによって構築された高次元モデル」を使用することで、入力された顔画像から有効な識別特徴を直接抽出し、コサイン距離を直接計算して顔認識を実行します。

顔検出は、基本的なコンピューター ビジョン技術から機械学習 (ML) の進歩、さらに高度化する人工ニューラル ネットワーク (ANN) や関連技術へと進化し、パフォーマンスが継続的に向上しています。

現在、顔追跡、顔分析、顔認識など、多くの主要なアプリケーションの最初のステップとして重要な役割を果たしています。

第二次世界大戦中、中国も戦争のトラウマに苦しみ、当時撮影された写真に写っている人々の多くは、もはや誰だか分からない状態になっている。

戦争によるトラウマを抱えた私たちの祖父母の世代の多くは、多くの親戚や友人を失いました。

この技術の開発により、人々は埃をかぶった過去を掘り起こし、過去の人々に慰めを見出すことができるようになるかもしれない。

参照: https://www.timesofisrael.com/google-engineer-identifies-anonymous-faces-in-wwii-photos-with-ai-facial-recognition/​

<<:  PyTorch 1.12 がリリース、Apple M1 チップ GPU アクセラレーションを正式にサポート、多くのバグを修正

>>:  チャットボットをよりエレガントに設計する方法

ブログ    
ブログ    
ブログ    

推薦する

...

コンテンツ推奨シナリオにおける自己教師学習の応用

背景機械学習コミュニティでは、教師なし学習(または自己教師あり学習)は長い間、最も価値のある分野の ...

AI導入の課題

人々は、データ、人、ビジネスなど、AI を導入する際の課題を理解する必要があります。 [[27672...

Natureサブジャーナル:ニューロモルフィックコンピューティングがさらに進歩し、科学者はニューロンとシナプスの人工シミュレーションを実現した

ニューロモルフィック コンピューティングは、人間の脳を構成するニューロンとシナプスのメカニズムを模倣...

電荷ベースの原子シミュレーションのための事前学習済み汎用ニューラルネットワーク CHGNet

複雑な電子相互作用の大規模シミュレーションは、原子モデル化における最大の課題の 1 つです。古典的な...

Appleが大規模モデル圧縮技術を革新、大規模モデルを携帯電話に搭載可能に

大規模言語モデル (LLM)、特に生成事前トレーニング済みトランスフォーマー (GPT) モデルは、...

ディープラーニングと群衆カウントの融合

【51CTO.comオリジナル記事】 1. はじめに:昨今、人工知能の研究が盛んになり、機械学習技術...

顔認識会社Clearviewのソースコードがサーバーの設定ミスにより公開される

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

マイクロソフトがAR仮想「翻訳機」をデモ、将来の翻訳業界に影響を与える

7月22日のニュース:AR技術は継続的な発展により、徐々に成熟してきました。他の新しいテクノロジーと...

アディダスのロボット工場で作られた靴が出荷されようとしている

アディダスがドイツに開設したロボット靴製造工場「スピードファクトリー」が正式に生産を開始したと報じら...

TIC 2018: クラウド サービスが人工知能の急速な発展を支援

[51CTO.comよりオリジナル記事] 中国の大手中立クラウドサービスプロバイダーUCloudが主...

2021年にITリーダーがAIと機械学習に期待すること

毎年末と翌年の初めに、IT 思想リーダーが翌年のテクノロジー、革新的なサービス、業界の進歩などの開発...

機械学習における小規模データの重要性

ビッグデータが何であるかを知っている人は多いですが、スモールデータと機械学習におけるその重要性を知っ...