マイクロソフト、世界規模の公開顔認識データベース MS Celeb を削除

マイクロソフト、世界規模の公開顔認識データベース MS Celeb を削除

フィナンシャル・タイムズによると、マイクロソフトは、約10万人の1000万枚以上の画像が含まれていたMSセレブデータベースをインターネットからひっそりと削除した。同報道によると、データベースはもともと学術目的だったが、商業組織によって使用され、マイクロソフトは商業利用の目的を制御できないという。

2016年に、マイクロソフトは約10万人の1,000万枚以上の画像からなるデータベースを構築しました。最近、フィナンシャル・タイムズによると、マイクロソフトはMS Celebと呼ばれるデータベースをインターネットからひっそりと削除したという。

2016年に最初に公開されたこのデータベースは、マイクロソフトによれば世界最大の公開顔認識データベースであり、世界中のテクノロジー企業や軍事研究者の顔認識システムのトレーニングに使用されている。

このデータベースは「セレブ」と呼ばれており、データベース内の顔は著名人であることを意味する。しかし、フィナンシャル・タイムズによると、データベースに登録されている人々の多くはこれを承認していなかったという。代わりに、画像や動画の検索では、クリエイティブ コモンズ ライセンスを通じて画像がクロールされます。 (ライセンスに基づき、学術研究のために写真を再利用できます。写真に写っている人物が必ずしも許可を与える必要はありませんが、著作権所有者が許可を与えます。)

「このウェブサイトは学術目的のために作られたものです」とマイクロソフト社はフィナンシャル・タイムズ紙に語った。「運営していたのはマイクロソフト社を退職した従業員で、現在は削除されています。」

本当に完全に削除できるのでしょうか?

しかし、ベルリンを拠点とする研究者アダム・ハーベイ氏が発見したMSセレブには、安全保障ジャーナリストや作家など、いわゆる「プライベートとされる」人々の画像も含まれている。アダム・ハーベイ氏はメガピクセルと呼ばれるプロジェクトを運営しており、このプロジェクトではそのようなデータベースの詳細を明らかにしている。

アダムはインタビューの中で、MS Celeb は削除されたが、そのコンテンツは依然としてオンラインで共有されているとも語った。 「データベースを消すことはできない。一度公開して人々がダウンロードすれば、それは世界中のハードドライブに存在することになる」と同氏は語った。

残念ながら、それはそれほど単純ではありません。 MS Celeb は、IBM、パナソニック、Nvidia、日立など多くの企業で使用されています。

マイクロソフト自身も、この技術を政府の監視手段として利用することに声高に反対してきた。マイクロソフトは2018年12月のブログ投稿で、企業に安全策を講じるよう、また政府に顔認識技術の規制を開始するよう呼びかけた。 4月初めには、マイクロソフト社がカリフォルニア州の法執行機関から警察車両やボディカメラに顔認識技術を搭載するよう要請されたが、女性や少数派に不当な影響を与えるとして拒否したと報じられている。

しかし、マイクロソフトの反対と善意は、限界がある。フィナンシャル・タイムズは、以前にデータをダウンロードした学術機関や企業は引き続き MS Celeb データベースを使用でき、データベースは引き続き GitHub、Dropbox、Baidu Cloud で共有されていると指摘した。 Gizmodoはマイクロソフトにコメントを求めたが、すぐには返答は得られなかった。

参考リンク:

https://gizmodo.com/microsoft-quietly-pulls-its-database-of-100-000-faces-u-1835296212

https://www.engadget.com/2019/06/06/microsoft-discreetly-wiped-its-massive-facial-recognition-databa

<<:  Java と Python のアルゴリズムとデータ構造に関する面接の質問

>>:  Google が新モデル EfficientNet をオープンソース化: 画像認識効率が 10 倍に向上、パラメータが 88% 削減

ブログ    

推薦する

北京初のT5レベル閉鎖型自動運転試験場が正式に運用開始

[[270070]] 7月8日、国家インテリジェント自動車・スマート交通(北京・天津・河北)実証区海...

...

ブラックテクノロジー検出法: 心拍を信号として利用し、偽モデルを「発見」

偽の肖像ビデオ生成技術は、政治宣伝、有名人のなりすまし、証拠の捏造、その他のアイデンティティ関連の操...

なぜスパムメールがこんなに多いのでしょうか? Redditの男が機械学習の残酷な現実を暴露

近年、AIのトレンドは高まるばかりで、毎年大規模な機械学習カンファレンスが盛んに開催されており、誰も...

清華大学と快手は、手動注釈なしで単一の参照画像に基づいて画像品質評価方法を生成しました。

導入生成画像の評価に関する既存の研究では、主に生成された画像の分布に基づいてモデルの「全体的な」生成...

マイクロソフトの無料 AI エッセイ採点ソフトウェアがアップグレード: IELTS、CET-4、CET-6 に使用可能

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

DNS 負荷分散ランキングアルゴリズムの理解

先ほど、DNS 負荷分散の概念をいくつか紹介しました。次に、この負荷分散テクノロジに関連するアルゴリ...

大規模モデル開発の中核: データエンジニアリング、自動評価、ナレッジグラフとの統合

1. 大規模モデル開発におけるデータエンジニアリング1. 大規模モデル向けのデータエンジニアリングと...

...

...

9月30日付けでマイクロソフトがAIサービス規約を更新:リバースエンジニアリング等に利用不可

マイクロソフトは8月16日、AI利用規約を発表し、9月30日に正式に発効すると発表した。新しい用語は...

次世代小売テクノロジー: IoT、AI、5G がショッピング体験に与える影響

今日の小売ショッピング体験は、データを活用しカスタマイズと体験を実現することがすべてです。モノのイン...

AIと機械学習のサイバーセキュリティという新興分​​野で考慮すべき3つのこと

[[343105]] [51CTO.com クイック翻訳] サイバー脅威の複雑さと数は時代とともに進...

人工知能は学習意欲のない人々に取って代わるのでしょうか?

AI は学習を望まない人々に取って代わるのでしょうか? 日常的に AI が使われる時代では、AI ...

Mamba 論文が ICLR に受け入れられなかったのはなぜですか? AIコミュニティは盛り上がっている

2023年、大規模AIモデルの分野におけるTransformerの優位性が揺らいだ。この挑戦のきっか...