ImageNetは人間の顔をぼかすことにしたが、ハスキー犬の顔の写真の認識率は急上昇した

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

315ガラは、顔認識がいかにひどいものかを皆に認識させました。海の向こう側では、世界で最も影響力のある AI データセットも行動を起こし始めています。

最近、 ImageNetデータセットでは、含まれる人々のプライバシーを保護するために、すべての顔をぼかすことを決定しました。

ImageNet のマネージャーの 1 人である Olga Russakovsky 氏は、 Fei-Fei Li 氏のチームと協力して、データセット内の顔を含むすべての画像を「パトロール」しました。

ImageNet には合計 1,000 以上のタグがありますが、そのうち人物に関連するタグは 3 つだけです。しかし、顔と関係ないように見えるタグの中にも、実は大量の顔写真が含まれていることがあります。

そこで研究チームは、Amazon Rekognition の自動顔認識とクラウドソーシングを利用して、150 万枚の写真の中から顔が写っている写真243,198 枚を見つけ出しました。

これらの画像に写っている562,626 個の顔はすべてぼかしが入っています。

人の顔をぼかすと AI モデルの有効性に影響しますか?これはおそらく錬金術を実践する人々が最も懸念している問題です。

プリンストン大学の博士課程の学生であるカイユ・ヤン氏は、データセットを修正した後、この問題に関する研究を行った。

偏差は大きくないが、結果は微妙である

研究者たちは、ぼやけたデータセットを物体検出とシーン検出のベンチマークに使用しました。

AlexNet、VGG、ResNetなど15の主流ネットワークモデルでテストした結果、Top-1の精度は最大1%低下し、平均低下はわずか0.66%、Top-5の精度は平均0.42%低下したことがわかりました。

画像内のぼやけた領域の割合に応じて、ぼかし率が増加するにつれて Top-1 精度は低下し、最高でも 4% を超えます。

ハーモニカやマスクなど、ぼやけた顔に近い一部のカテゴリのオブジェクトでは、分類エラー率が高くなります。

不可解なのは、「ハスキー」や「エスキモー犬」のカテゴリーなど、顔のない写真の中には精度に大きな変動があるものがあることだ。

その中で、エスキモー犬の認識精度は大幅に低下したのに対し、ハスキー犬の認識精度は大幅に向上しました。

両方のカテゴリーの画像のほとんどに顔が写っていないのは、筆者自身も奇妙だと感じました。具体的な理由は、さらなる調査を通じてのみ発見できる。

MITの科学者アレクサンダー・マドリー氏は、ぼかしを入れた顔のデータセットで訓練されたAIは時々奇妙な結果をもたらす可能性があり、データの偏りは非常に微妙だが深刻な結果をもたらす可能性があると考えている。

プライバシーと偏見にノーと言う

2020年、コンピュータサイエンス倫理に関する学術会議であるFAccTにおいて、ImageNetデータセットは「人間」サブツリー内の2,702の同義語セットを削除しました。これらのカテゴリには不快、軽蔑的、またはわいせつな表現が含まれていたためです。たとえば、人種差別や性差別的な内容などです。

ImageNet はプライバシー問題に大きな変化をもたらしましたが、UnifyID の主任科学者 Vinay Prabhu 氏は、データセットには依然として多くの深刻な問題があると指摘しました。

昨年7月、プラブー氏は、ImageNetやTiny Imagesなどの画像データセットにはプライバシーを脅かす状況が含まれているだけでなく、言葉では言い表せないような画像も含まれていると指摘する論文を発表した。

その論文の中で、プラブー氏はデータセット内の顔をぼかし、参加者の明示的な同意を得た場合にのみ画像を収集し、そのようなデータセットに対してデータ共有ライセンスを作成しないことを推奨している。

彼はこの問題を報告するために 10 か月連続で ImageNet チームに電子メールを送信しましたが、Fei-Fei Li からの返信が届いたのは昨年 4 月になってからでした。

しかし、ImageNet チームの論文では彼の名前は引用されていなかった。Wired 誌のインタビューで、プラブ氏は ImageNet チームが彼の研究を認めなかったことに失望を表明した。

ルサコフスキー氏は、論文の最新版ではプラブー氏の研究を引用すると答えた。

2019年、マイクロソフトは、関係者の同意を得ていない1,000万枚の画像を含むMSセレブ顔データセットをひっそりと削除しました。

デューク大学のMTMCやスタンフォード大学のブレインウォッシュなど、公共のカメラを使用して以前に収集されたデータセットはすべて近年削除されました。

プライバシーに対する一般の意識が高まり、法律が徐々に改善されるにつれて、AI データセットがユーザーのプライバシーを保護する時代が来ています。

<<: 「顔認識」はあなたの「顔」を盗む

>>: AIモデルは兆レベルの時代へと加速しており、中国のAIコンピューティングパワーは世界の30％を占めています

2020年にAIがビジネスにもたらす変化

ブログ

クラウドコンピューティングは、サービスアウトソーシングアルゴリズムに、減算から加算への革命をもたらしました。

ブログ

ハッカーたちは猫娘を作成する代わりに、一流の原子力研究所から何十万ものデータを盗んだ...

ブログ

Google の最新画像処理ソフトウェア Imagen 2 がリリースされ、実機テストでは DALL·E 3 や Midjourney に勝利しました。

ブログ

ImageNetは人間の顔をぼかすことにしたが、ハスキー犬の顔の写真の認識率は急上昇した

偏差は大きくないが、結果は微妙である

プライバシーと偏見にノーと言う

2020年にAIがビジネスにもたらす変化

クラウドコンピューティングは、サービスアウトソーシングアルゴリズムに、減算から加算への革命をもたらしました。

ハッカーたちは猫娘を作成する代わりに、一流の原子力研究所から何十万ものデータを盗んだ...

Google の最新画像処理ソフトウェア Imagen 2 がリリースされ、実機テストでは DALL·E 3 や Midjourney に勝利しました。

推薦する

ディープラーニングを専門家以外の人に説明するにはどうすればよいでしょうか?

Metaがオープンソース「AIアベンジャーズアライアンス」の結成を主導、AMDと他の同盟国が800億ドルでOpenAI Nvidiaと戦う

機械に漢字の一画一画の謎を理解させるにはどうすればいいでしょうか?

やがて世界は人工知能に支配されるようになる。ホーキング博士の死後、人工知能の発展に冷水を浴びせるのは誰だろうか？

IoTとAIがスマートホームにもたらす効果

1 つのバグが原因で 200 億ドルの損失が発生しました。ビジネス異常検出システムを構築するにはどうすればよいでしょうか?

ロボットインテリジェント把持システム：いくつかの主流ソリューション

AIが高度な数学の核心を突破、微分方程式と不定積分を1秒以内に解き、その性能はMatlabをはるかに上回る

一貫性のあるハッシュを使用して重要な負荷を分散する

機械学習の実践: Spark と Python を組み合わせるには?

子どもたちがロボットに出会うと、彼らの社会的交流はどのように変化するのでしょうか?

人工知能に関するTEDトークトップ10

Meili United のビジネスアップグレードにおける機械学習の応用

待望のAIは人工知能か、それとも人工的な愚かさか？

人間が作成したデータは高価すぎます!開発者はAI合成データをひそかに使用してモデルをトレーニングしている