マイクロソフト、世界規模の公開顔認識データベース MS Celeb を削除

フィナンシャル・タイムズによると、マイクロソフトは、約10万人の1000万枚以上の画像が含まれていたMSセレブデータベースをインターネットからひっそりと削除した。同報道によると、データベースはもともと学術目的だったが、商業組織によって使用され、マイクロソフトは商業利用の目的を制御できないという。

2016年に、マイクロソフトは約10万人の1,000万枚以上の画像からなるデータベースを構築しました。最近、フィナンシャル・タイムズによると、マイクロソフトはMS Celebと呼ばれるデータベースをインターネットからひっそりと削除したという。

2016年に最初に公開されたこのデータベースは、マイクロソフトによれば世界最大の公開顔認識データベースであり、世界中のテクノロジー企業や軍事研究者の顔認識システムのトレーニングに使用されている。

このデータベースは「セレブ」と呼ばれており、データベース内の顔は著名人であることを意味する。しかし、フィナンシャル・タイムズによると、データベースに登録されている人々の多くはこれを承認していなかったという。代わりに、画像や動画の検索では、クリエイティブコモンズライセンスを通じて画像がクロールされます。 (ライセンスに基づき、学術研究のために写真を再利用できます。写真に写っている人物が必ずしも許可を与える必要はありませんが、著作権所有者が許可を与えます。)

「このウェブサイトは学術目的のために作られたものです」とマイクロソフト社はフィナンシャル・タイムズ紙に語った。「運営していたのはマイクロソフト社を退職した従業員で、現在は削除されています。」

本当に完全に削除できるのでしょうか？

しかし、ベルリンを拠点とする研究者アダム・ハーベイ氏が発見したMSセレブには、安全保障ジャーナリストや作家など、いわゆる「プライベートとされる」人々の画像も含まれている。アダム・ハーベイ氏はメガピクセルと呼ばれるプロジェクトを運営しており、このプロジェクトではそのようなデータベースの詳細を明らかにしている。

アダムはインタビューの中で、MS Celeb は削除されたが、そのコンテンツは依然としてオンラインで共有されているとも語った。「データベースを消すことはできない。一度公開して人々がダウンロードすれば、それは世界中のハードドライブに存在することになる」と同氏は語った。

残念ながら、それはそれほど単純ではありません。 MS Celeb は、IBM、パナソニック、Nvidia、日立など多くの企業で使用されています。

マイクロソフト自身も、この技術を政府の監視手段として利用することに声高に反対してきた。マイクロソフトは2018年12月のブログ投稿で、企業に安全策を講じるよう、また政府に顔認識技術の規制を開始するよう呼びかけた。 4月初めには、マイクロソフト社がカリフォルニア州の法執行機関から警察車両やボディカメラに顔認識技術を搭載するよう要請されたが、女性や少数派に不当な影響を与えるとして拒否したと報じられている。

しかし、マイクロソフトの反対と善意は、限界がある。フィナンシャル・タイムズは、以前にデータをダウンロードした学術機関や企業は引き続き MS Celeb データベースを使用でき、データベースは引き続き GitHub、Dropbox、Baidu Cloud で共有されていると指摘した。 Gizmodoはマイクロソフトにコメントを求めたが、すぐには返答は得られなかった。

参考リンク:

https://gizmodo.com/microsoft-quietly-pulls-its-database-of-100-000-faces-u-1835296212

https://www.engadget.com/2019/06/06/microsoft-discreetly-wiped-its-massive-facial-recognition-databa

<<: Java と Python のアルゴリズムとデータ構造に関する面接の質問

>>: Google が新モデル EfficientNet をオープンソース化: 画像認識効率が 10 倍に向上、パラメータが 88% 削減