コーヒーショップの監視ビデオが流出し、何百万人もの人々が視聴していた。マスク氏は「ひどい!」と叫んだ。 AIはあなたがコーヒーをどれくらい飲んだかを正確に把握しています

コーヒーショップの監視ビデオが流出し、何百万人もの人々が視聴していた。マスク氏は「ひどい!」と叫んだ。 AIはあなたがコーヒーをどれくらい飲んだかを正確に把握しています

私たちはプライバシーがますます少なくなる世界に住んでいます。

今日、ネット上で拡散されたこのビデオは多くの人を怖がらせました。

コーヒーショップでは、各顧客が店内に数分間滞在した時間と、各ウェイターが顧客に持ってきたコーヒーのカップ数がすべてビデオで明確に表示されました。

このビデオは12時間ほど前に公開されたが、すでに100万人以上の視聴者を集めている。

この動画を投稿したネットユーザーはこう述べた。「このコンセプトは、コーヒーショップがAIを使ってバリスタと顧客を分析する方法を示しています。」プライベートなカフェ空間を存分にお楽しみください。 😂

別のネットユーザーは、これは驚くべきことではないと述べた。消費者として、多くの店舗ではあなたが店に入った瞬間にあなたのことをすべて知っているということを知っておくべきです。

それに比べれば、ケンブリッジ・アナリティカ事件は見劣りする。

(2018年、フェイスブックは、英国のデータ分析会社が2016年にフェイスブックのユーザー5000万人の情報を違法に入手し、その情報を使って投票結果を予測し影響を与えるソフトウェアプログラムを構築し、トランプ大統領の勝利を助けたことを認めた。)

コメント欄にはマスク氏自身も現れ、感嘆符を2つ続けて付けた。

AIがカフェの従業員や顧客をスパイするという考えが十分に恐ろしいと思うなら、コストを考慮に入れなければ、空には何千ものドローンがいて、リアルタイムの追跡データを規制当局に送信し、すべてが追跡され、記録される可能性があるというのが現実です。

現在の物体検出および画像認識技術は非常に強力なので、専門部門さえ必要ありません。誰でもアマチュアのドローンで追跡を行うことができます。

数年前、個別のグラフィック カードで 1080p ストリーミングを実行する場合、最大容量は 6 オブジェクトのみであったことを知っておく必要があります。

どこにでも目がある

現実には、今日の世界はカメラで溢れています。

これらの企業の多くは、AIとビデオフィードの視覚認識を駆使して、消費者を追跡するための非常に秘密裏な戦略を展開しています。

たとえば、ウォルマートのスマート リテール ラボでは、IRL センサーとカメラにより、スタッフが店舗内のすべての情報を把握できます。

ファーストフード店も従業員の監視にAI技術を導入している。ここでは従業員にマスクの着用が義務付けられており、誰かがマスクを外すと、管理者はすぐに気付きます。

さらに、当社のモバイル位置情報データも販売されています。

ほぼすべての携帯電話事業者は、小売店に匿名でデータを販売しており、これは事業者の主要事業の一部であると言えます。

「オペレーター名 + クラウドインサイト」を Google で検索するだけで、結果に驚かれることでしょう。

「特定の時間に特定の場所を何人の人が通過するかを知りたいですか?彼らの年齢や収入状況は?彼らのうち何人が潜在顧客になるか?」

もちろん、「Crowd Insights」サービスでは、データが匿名であり、データの収集方法によって個人のプライバシーが漏洩することはないということを強調します。

「私のデータが収集されたら、会社に支払いを求めることはできますか?」と言う人もいます。

企業で使用されているカメラに関して、コメント欄で次のような経験談をシェアした人がいました。

「私はスタジアムのバックエンドのセキュリティカメラシステムに携わっていますが、私たちが公開しているのは実際のデータの3分の1だけです。」

「まるで映画のように、顔を近づけるとシステムがあなたの居場所を知らせてくれます。」

これを実現するために必要なのは、任意のウェブカメラを用意し、300 ドルのソフトウェアをインストールし、ディスク容量がなくなるまで実行するだけです。

長所と短所は?

この点に関して、AIコンサルティングの専門家であるDiego San Esteban氏は次のように見解を述べています。

彼は、AI モニタリングには、従業員のパフォーマンスと生産性を継続的にモニタリングし、管理者がより適切な戦略を策定できるなど、多くの利点があると考えています。

さらに、AI は客観的なパフォーマンス データを提供して、評価における人間の偏見を回避することもできます。

デメリットも数多くあります。最も批判されるのは、もちろん従業員のプライバシー権の侵害です。また、社内に不信感を生み、士気や仕事の満足度にも影響を及ぼします。

AI は、作業が行われている状況を完全に理解できず、人間的な共感力も欠いています。

さらに、トレーニング データに内在するバイアスによって間違いが発生したり、影響を受けたりする可能性が高く、これは従業員にとって非常に不公平です。

物体検出アルゴリズム

実際、この物議を醸した事件の背後には、非常に一般的な AI 技術である物体検出があります。

たとえば、街路の写真が与えられた場合、オブジェクト検出モデルは、画像内のさまざまなオブジェクト(信号機、車両、道路標識、建物など)の注釈またはラベルのリストを返します。

これらのラベルには、「人物」などの各オブジェクトの適切なカテゴリと、オブジェクトを完全に囲む長方形の領域である「境界ボックス」が含まれます。

産業アプリケーション

物体検出は人間にとって非常に重要なタスクです。新しい部屋やシーンに入るとき、私たちの最初の反応は、そこにある物体や人を視覚的に評価し、理解することです。

人間と同様に、物体検出はコンピュータが視覚世界を理解して対話できるようにする上で重要な役割を果たしており、多くの業界で広く使用されています。

- サイトの安全性:

オブジェクト検出モデルは、職場の安全性とセキュリティの向上に役立ちます。たとえば、機密エリアにおける不審な人物や車両の存在を検出できます。さらに革新的なのは、作業員が手袋、ヘルメット、マスクなどの個人用保護具(PPE)を確実に使用できるようにすることだ。

- ソーシャルメディア:

オブジェクト検出モデルは、デジタル メディア内の特定のブランド、製品、ロゴ、または人物の存在を識別するのに役立ちます。広告主はこの情報を使用してデータを収集し、ユーザーにより関連性の高い広告を表示できます。また、不適切または禁止されているコンテンツを検出してフラグを付けるプロセスを自動化するのにも役立ちます。

- 品質管理:

オブジェクト検出モデルにより、視覚データの自動レビューが可能になります。コンピュータとカメラはデータをリアルタイムで分析し、視覚情報を自動的に検出して処理し、その重要性を理解することができるため、継続的な視覚的な確認を必要とするタスクにおける人間の介入を減らすことができます。これは製造生産の品質管理に特に役立ちます。効率が向上するだけでなく、人間の目では気付かない可能性のある生産上の異常も検出できるため、生産の中断や製品のリコールの可能性を防ぐことができます。

初めて66 APに到達し、最強のSOTAアルゴリズムがリストのトップに

現在、ターゲット検出アルゴリズムの性能に関しては、国内チームの「DETRs with Collaborative Hybrid Assignments Training」が最大66 APのスコアでCOCOリストのトップを占めています。この研究はICCV 2023に採択されました。

この論文では、著者らは、多様なラベル割り当て方法からより効率的で効果的な DETR ベースの検出器を学習できる、新しい共同ハイブリッド割り当てトレーニング スキームである Co-DETR を提案しました。

複数の並列補助ヘッド(ATSS や Faster RCNN などの 1 対多のラベル割り当てによって監視)をトレーニングすることにより、新しい Co-DETR はエンドツーエンド検出器のエンコーダーの学習能力を簡単に向上させることができます。

追加のカスタマイズされた正のクエリのためにこれらの補助ヘッドから正の座標を抽出することにより、Co-DETR はデコーダー内の正のサンプルのトレーニング効率も向上させることができます。

さらに、推論中にこれらの補助ヘッドは破棄されるため、この方法では元の検出器に追加のパラメーターや計算コストが導入されず、手動の非最大抑制 (NMS) も必要ありません。

論文アドレス: https://arxiv.org/abs/2211.12860v5

プロジェクトアドレス: https://github.com/Sense-X/Co-DETR

- エンコーダの最適化:

トレーニング スキームでは、1 対多のラベル割り当てによって監視される複数の並列補助ヘッドをトレーニングすることにより、エンドツーエンド検出器のエンコーダの学習能力を簡単に向上できます。

- デコーダーの最適化:

これらの補助ヘッドから正の座標を抽出することにより、追加のカスタマイズされた正のクエリが実行され、デコーダーの注意学習が改善されます。

- SOTAパフォーマンス:

ViT-L(304Mパラメータ)を搭載したCo-DETRは、COCOテスト開発で66.0%のAPを達成した最初のモデルです。

実験結果によると、Swin-L バックボーン ネットワークに基づく Co-DETR メソッドにより、既存の SOTA モデル DINO-Deformable-DETR のパフォーマンスが 58.5% から 59.5% に向上します (COCO 検証セット)。

ViT-L バックボーン ネットワークのサポートにより、Co-DETR は COCO テスト開発で 66.0% AP、LVIS 検証セットで 67.9% AP を達成しました。

さらに、Co-DETR は、従来の方法と比較して、より小さなモデル サイズでより優れたパフォーマンスを実現します。

<<:  ボストン大学の「Platypus-70B」がHugging Face大型模型ランキングでトップに!効率的なデータセットと独自のLoRA微調整が鍵

>>:  AIGC: 将来は誰が支払うのでしょうか?

推薦する

...

LSTMとトランスフォーマーの利点を組み合わせることで、DeepMindの強化学習エージェントはデータ効率を向上させます

[[423163]]近年、マルチエージェント強化学習は飛躍的な進歩を遂げています。例えば、Deep...

AI規制論争が再燃、しかしウォール街は依然として熱狂的

米国政府は最近、新たな AI 規制を発表し、AI のセキュリティ上の懸念に再び世界の注目が集まってい...

5分間の技術講演 | AI技術と「サイバー暴力」のガバナンス

パート01 「ネットいじめ」とは何ですか? 「サイバー暴力」とは、インターネット上で文章、画像、動画...

将来的には配送車両の80%が自動運転技術を使用する

[[251814]]フォード、トヨタ、グーグル、アップルなどの大企業が自動運転車に投資していることは...

...

機械学習プロジェクト用の Python インターフェースを設計する方法

序文機械学習プロジェクトを実行するには、まずモデルを(ほとんどの場合は予測 API として)デプロイ...

世界中の人工知能企業の数:米国 2,028 社、インド 800 社、中国はどうでしょうか?

テクノロジーは生活を変えるだけでなく、世界も変えることができます。 1760年代初頭、イギリスを中心...

...

...

キング・オブ・グローリーのプレイからサッカーのプレイまで、テンセントのAIが再び進化

テンセントは12月30日、同社の人工知能チームが第1回Google Football Kaggleコ...

Excel 愛好家ですか?コンピュータービジョンのための細胞: 顔検出とOCRは問題なし

コンピュータービジョンとは何ですか?プロフェッショナルすぎると、やる気をなくしてしまうのでしょうか?...

機械学習とデータサイエンスに関する必読の無料オンライン電子書籍 10 冊

KDnuggets 編集者の Matthew Mayo が、機械学習とデータ サイエンスに関連する書...

...

...