マイクロソフト、世界規模の公開顔認識データベース MS Celeb を削除

マイクロソフト、世界規模の公開顔認識データベース MS Celeb を削除

フィナンシャル・タイムズによると、マイクロソフトは、約10万人の1000万枚以上の画像が含まれていたMSセレブデータベースをインターネットからひっそりと削除した。同報道によると、データベースはもともと学術目的だったが、商業組織によって使用され、マイクロソフトは商業利用の目的を制御できないという。

2016年に、マイクロソフトは約10万人の1,000万枚以上の画像からなるデータベースを構築しました。最近、フィナンシャル・タイムズによると、マイクロソフトはMS Celebと呼ばれるデータベースをインターネットからひっそりと削除したという。

2016年に最初に公開されたこのデータベースは、マイクロソフトによれば世界最大の公開顔認識データベースであり、世界中のテクノロジー企業や軍事研究者の顔認識システムのトレーニングに使用されている。

このデータベースは「セレブ」と呼ばれており、データベース内の顔は著名人であることを意味する。しかし、フィナンシャル・タイムズによると、データベースに登録されている人々の多くはこれを承認していなかったという。代わりに、画像や動画の検索では、クリエイティブ コモンズ ライセンスを通じて画像がクロールされます。 (ライセンスに基づき、学術研究のために写真を再利用できます。写真に写っている人物が必ずしも許可を与える必要はありませんが、著作権所有者が許可を与えます。)

「このウェブサイトは学術目的のために作られたものです」とマイクロソフト社はフィナンシャル・タイムズ紙に語った。「運営していたのはマイクロソフト社を退職した従業員で、現在は削除されています。」

本当に完全に削除できるのでしょうか?

しかし、ベルリンを拠点とする研究者アダム・ハーベイ氏が発見したMSセレブには、安全保障ジャーナリストや作家など、いわゆる「プライベートとされる」人々の画像も含まれている。アダム・ハーベイ氏はメガピクセルと呼ばれるプロジェクトを運営しており、このプロジェクトではそのようなデータベースの詳細を明らかにしている。

アダムはインタビューの中で、MS Celeb は削除されたが、そのコンテンツは依然としてオンラインで共有されているとも語った。 「データベースを消すことはできない。一度公開して人々がダウンロードすれば、それは世界中のハードドライブに存在することになる」と同氏は語った。

残念ながら、それはそれほど単純ではありません。 MS Celeb は、IBM、パナソニック、Nvidia、日立など多くの企業で使用されています。

マイクロソフト自身も、この技術を政府の監視手段として利用することに声高に反対してきた。マイクロソフトは2018年12月のブログ投稿で、企業に安全策を講じるよう、また政府に顔認識技術の規制を開始するよう呼びかけた。 4月初めには、マイクロソフト社がカリフォルニア州の法執行機関から警察車両やボディカメラに顔認識技術を搭載するよう要請されたが、女性や少数派に不当な影響を与えるとして拒否したと報じられている。

しかし、マイクロソフトの反対と善意は、限界がある。フィナンシャル・タイムズは、以前にデータをダウンロードした学術機関や企業は引き続き MS Celeb データベースを使用でき、データベースは引き続き GitHub、Dropbox、Baidu Cloud で共有されていると指摘した。 Gizmodoはマイクロソフトにコメントを求めたが、すぐには返答は得られなかった。

参考リンク:

https://gizmodo.com/microsoft-quietly-pulls-its-database-of-100-000-faces-u-1835296212

https://www.engadget.com/2019/06/06/microsoft-discreetly-wiped-its-massive-facial-recognition-databa

<<:  Java と Python のアルゴリズムとデータ構造に関する面接の質問

>>:  Google が新モデル EfficientNet をオープンソース化: 画像認識効率が 10 倍に向上、パラメータが 88% 削減

推薦する

ロボット工学が建設業界の新時代を告げる

建設業界は現在、デジタル革新が業界の方向性をますます推進する中で、大きな変革期を迎えています。ロボッ...

アルゴリズムエンジニアのメリット: 超実践的技術ロードマップ

これは、会社のアルゴリズム グループの同僚向けに作成された技術ロードマップです。主な目的は、技術ルー...

DragGANはオープンソース化から3日間で23,000のスターを獲得し、DragDiffusionが登場しました。

AIGC の魔法の世界では、画像を「ドラッグ」することで、必要な画像を変更したり合成したりできます...

TensorFlowはディープラーニングに基づく画像補完を実装する

[[191845]]目次■ はじめに■ ステップ1: 画像を確率分布のサンプルとして理解する不足して...

賈強淮: Ant大規模知識グラフの構築とその応用

1. アトラスの概要まず、ナレッジグラフの基本的な概念をいくつか紹介します。 1. ナレッジグラフと...

...

2022年の政府活動報告を聞いた後、人工知能業界が注目するべき点は以下のとおりです。

2022年全国人民代表大会と中国人民政治協商会議が開幕した。3月5日には2022年政府活動報告が発...

文部科学省が文書を発表:AI、アルゴリズム等が2018年度から高等学校の教育課程に取り入れられる!

教育部はこのほど記者会見を開き、「高等学校一般教育課程計画及び中国語等教科教育課程基準(2017年版...

ARMベースの3DES暗号化アルゴリズムの実装(2)

ARMベースのハードウェア実装3DESアルゴリズムと一般的な組み込みアプリケーションの要件に応じて...

初心者からビッグデータ人工知能の専門家になるまでの学習プロセス

ビッグデータ処理技術をどのように学ぶか?まず、Python言語とLinuxオペレーティングシステムを...

CIIE 2019 サノフィと朱江知能が共同で医療のデジタル未来を創造

第2回中国国際輸入博覧会が11月10日に成功裏に終了した。医療機器と医薬健康展示エリアでは、世界有数...

ガートナーの2020年人工知能技術ハイプサイクルを通して新たな変化を見る

ガートナーの最近の調査によると、企業の47%が流行の発生以来人工知能(AI)への投資を維持しており、...

エッジコンピューティングにおける AI の利点

エッジと極端エッジの間でこれがどのように展開するか、また無線アクセス ネットワークにどのような階層が...

...

リアルタイムの洞察を強化: コンピューター ビジョンとエッジ コンピューティングの相乗効果

今日の急速に変化する世界では、最先端技術のシームレスな統合がイノベーションの基盤となっています。その...