コーヒーショップの監視ビデオが流出し、何百万人もの人々が視聴していた。マスク氏は「ひどい!」と叫んだ。 AIはあなたがコーヒーをどれくらい飲んだかを正確に把握しています

コーヒーショップの監視ビデオが流出し、何百万人もの人々が視聴していた。マスク氏は「ひどい!」と叫んだ。 AIはあなたがコーヒーをどれくらい飲んだかを正確に把握しています

私たちはプライバシーがますます少なくなる世界に住んでいます。

今日、ネット上で拡散されたこのビデオは多くの人を怖がらせました。

コーヒーショップでは、各顧客が店内に数分間滞在した時間と、各ウェイターが顧客に持ってきたコーヒーのカップ数がすべてビデオで明確に表示されました。

このビデオは12時間ほど前に公開されたが、すでに100万人以上の視聴者を集めている。

この動画を投稿したネットユーザーはこう述べた。「このコンセプトは、コーヒーショップがAIを使ってバリスタと顧客を分析する方法を示しています。」プライベートなカフェ空間を存分にお楽しみください。 😂

別のネットユーザーは、これは驚くべきことではないと述べた。消費者として、多くの店舗ではあなたが店に入った瞬間にあなたのことをすべて知っているということを知っておくべきです。

それに比べれば、ケンブリッジ・アナリティカ事件は見劣りする。

(2018年、フェイスブックは、英国のデータ分析会社が2016年にフェイスブックのユーザー5000万人の情報を違法に入手し、その情報を使って投票結果を予測し影響を与えるソフトウェアプログラムを構築し、トランプ大統領の勝利を助けたことを認めた。)

コメント欄にはマスク氏自身も現れ、感嘆符を2つ続けて付けた。

AIがカフェの従業員や顧客をスパイするという考えが十分に恐ろしいと思うなら、コストを考慮に入れなければ、空には何千ものドローンがいて、リアルタイムの追跡データを規制当局に送信し、すべてが追跡され、記録される可能性があるというのが現実です。

現在の物体検出および画像認識技術は非常に強力なので、専門部門さえ必要ありません。誰でもアマチュアのドローンで追跡を行うことができます。

数年前、個別のグラフィック カードで 1080p ストリーミングを実行する場合、最大容量は 6 オブジェクトのみであったことを知っておく必要があります。

どこにでも目がある

現実には、今日の世界はカメラで溢れています。

これらの企業の多くは、AIとビデオフィードの視覚認識を駆使して、消費者を追跡するための非常に秘密裏な戦略を展開しています。

たとえば、ウォルマートのスマート リテール ラボでは、IRL センサーとカメラにより、スタッフが店舗内のすべての情報を把握できます。

ファーストフード店も従業員の監視にAI技術を導入している。ここでは従業員にマスクの着用が義務付けられており、誰かがマスクを外すと、管理者はすぐに気付きます。

さらに、当社のモバイル位置情報データも販売されています。

ほぼすべての携帯電話事業者は、小売店に匿名でデータを販売しており、これは事業者の主要事業の一部であると言えます。

「オペレーター名 + クラウドインサイト」を Google で検索するだけで、結果に驚かれることでしょう。

「特定の時間に特定の場所を何人の人が通過するかを知りたいですか?彼らの年齢や収入状況は?彼らのうち何人が潜在顧客になるか?」

もちろん、「Crowd Insights」サービスでは、データが匿名であり、データの収集方法によって個人のプライバシーが漏洩することはないということを強調します。

「私のデータが収集されたら、会社に支払いを求めることはできますか?」と言う人もいます。

企業で使用されているカメラに関して、コメント欄で次のような経験談をシェアした人がいました。

「私はスタジアムのバックエンドのセキュリティカメラシステムに携わっていますが、私たちが公開しているのは実際のデータの3分の1だけです。」

「まるで映画のように、顔を近づけるとシステムがあなたの居場所を知らせてくれます。」

これを実現するために必要なのは、任意のウェブカメラを用意し、300 ドルのソフトウェアをインストールし、ディスク容量がなくなるまで実行するだけです。

長所と短所は?

この点に関して、AIコンサルティングの専門家であるDiego San Esteban氏は次のように見解を述べています。

彼は、AI モニタリングには、従業員のパフォーマンスと生産性を継続的にモニタリングし、管理者がより適切な戦略を策定できるなど、多くの利点があると考えています。

さらに、AI は客観的なパフォーマンス データを提供して、評価における人間の偏見を回避することもできます。

デメリットも数多くあります。最も批判されるのは、もちろん従業員のプライバシー権の侵害です。また、社内に不信感を生み、士気や仕事の満足度にも影響を及ぼします。

AI は、作業が行われている状況を完全に理解できず、人間的な共感力も欠いています。

さらに、トレーニング データに内在するバイアスによって間違いが発生したり、影響を受けたりする可能性が高く、これは従業員にとって非常に不公平です。

物体検出アルゴリズム

実際、この物議を醸した事件の背後には、非常に一般的な AI 技術である物体検出があります。

たとえば、街路の写真が与えられた場合、オブジェクト検出モデルは、画像内のさまざまなオブジェクト(信号機、車両、道路標識、建物など)の注釈またはラベルのリストを返します。

これらのラベルには、「人物」などの各オブジェクトの適切なカテゴリと、オブジェクトを完全に囲む長方形の領域である「境界ボックス」が含まれます。

産業アプリケーション

物体検出は人間にとって非常に重要なタスクです。新しい部屋やシーンに入るとき、私たちの最初の反応は、そこにある物体や人を視覚的に評価し、理解することです。

人間と同様に、物体検出はコンピュータが視覚世界を理解して対話できるようにする上で重要な役割を果たしており、多くの業界で広く使用されています。

- サイトの安全性:

オブジェクト検出モデルは、職場の安全性とセキュリティの向上に役立ちます。たとえば、機密エリアにおける不審な人物や車両の存在を検出できます。さらに革新的なのは、作業員が手袋、ヘルメット、マスクなどの個人用保護具(PPE)を確実に使用できるようにすることだ。

- ソーシャルメディア:

オブジェクト検出モデルは、デジタル メディア内の特定のブランド、製品、ロゴ、または人物の存在を識別するのに役立ちます。広告主はこの情報を使用してデータを収集し、ユーザーにより関連性の高い広告を表示できます。また、不適切または禁止されているコンテンツを検出してフラグを付けるプロセスを自動化するのにも役立ちます。

- 品質管理:

オブジェクト検出モデルにより、視覚データの自動レビューが可能になります。コンピュータとカメラはデータをリアルタイムで分析し、視覚情報を自動的に検出して処理し、その重要性を理解することができるため、継続的な視覚的な確認を必要とするタスクにおける人間の介入を減らすことができます。これは製造生産の品質管理に特に役立ちます。効率が向上するだけでなく、人間の目では気付かない可能性のある生産上の異常も検出できるため、生産の中断や製品のリコールの可能性を防ぐことができます。

初めて66 APに到達し、最強のSOTAアルゴリズムがリストのトップに

現在、ターゲット検出アルゴリズムの性能に関しては、国内チームの「DETRs with Collaborative Hybrid Assignments Training」が最大66 APのスコアでCOCOリストのトップを占めています。この研究はICCV 2023に採択されました。

この論文では、著者らは、多様なラベル割り当て方法からより効率的で効果的な DETR ベースの検出器を学習できる、新しい共同ハイブリッド割り当てトレーニング スキームである Co-DETR を提案しました。

複数の並列補助ヘッド(ATSS や Faster RCNN などの 1 対多のラベル割り当てによって監視)をトレーニングすることにより、新しい Co-DETR はエンドツーエンド検出器のエンコーダーの学習能力を簡単に向上させることができます。

追加のカスタマイズされた正のクエリのためにこれらの補助ヘッドから正の座標を抽出することにより、Co-DETR はデコーダー内の正のサンプルのトレーニング効率も向上させることができます。

さらに、推論中にこれらの補助ヘッドは破棄されるため、この方法では元の検出器に追加のパラメーターや計算コストが導入されず、手動の非最大抑制 (NMS) も必要ありません。

論文アドレス: https://arxiv.org/abs/2211.12860v5

プロジェクトアドレス: https://github.com/Sense-X/Co-DETR

- エンコーダの最適化:

トレーニング スキームでは、1 対多のラベル割り当てによって監視される複数の並列補助ヘッドをトレーニングすることにより、エンドツーエンド検出器のエンコーダの学習能力を簡単に向上できます。

- デコーダーの最適化:

これらの補助ヘッドから正の座標を抽出することにより、追加のカスタマイズされた正のクエリが実行され、デコーダーの注意学習が改善されます。

- SOTAパフォーマンス:

ViT-L(304Mパラメータ)を搭載したCo-DETRは、COCOテスト開発で66.0%のAPを達成した最初のモデルです。

実験結果によると、Swin-L バックボーン ネットワークに基づく Co-DETR メソッドにより、既存の SOTA モデル DINO-Deformable-DETR のパフォーマンスが 58.5% から 59.5% に向上します (COCO 検証セット)。

ViT-L バックボーン ネットワークのサポートにより、Co-DETR は COCO テスト開発で 66.0% AP、LVIS 検証セットで 67.9% AP を達成しました。

さらに、Co-DETR は、従来の方法と比較して、より小さなモデル サイズでより優れたパフォーマンスを実現します。

<<:  ボストン大学の「Platypus-70B」がHugging Face大型模型ランキングでトップに!効率的なデータセットと独自のLoRA微調整が鍵

>>:  AIGC: 将来は誰が支払うのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

分類アルゴリズムの概要

[[151327]]決定木分類アルゴリズム決定木誘導は古典的な分類アルゴリズムです。これは、トップダ...

不妊治療の新たな夜明け:AI

世界初の試験管ベビーは1978年に英国で誕生した。それ以来、人工生殖技術は継続的に改良されてきました...

...

Appleが自社チップ用のオープンソースフレームワークMLXを開発、Llama 7Bを実装しM2 Ultraで動作

2020年11月、Appleは速度と強力な機能の点で驚異的なM1チップを発売しました。 2022年に...

機械学習の問題に適した事前トレーニング済みモデルを選択する方法

[[264482]]この記事では転移学習とは何か、どのように使用するのかを簡単に紹介します。転移学習...

人工知能を活用して機密情報を保護する 5 つの方法

研究者たちは、人工知能技術が機密情報のセキュリティを確保するための非常に優れたツールであることを発見...

...

思考連鎖CoTは思考マップGoTへと進化し、思考ツリーよりも優れたヒントエンジニアリング技術が誕生した

大規模言語モデル (LLM) の機能を最大限に活用するには、効果的なプロンプト設計ソリューションが不...

2021 年にグラフ機械学習にはどのような新たなブレークスルーがあるでしょうか?マギル大学のポスドク研究員が分野の動向を整理

[[443041]]今年ももうすぐ終わり、あと3日で2021年も終わりです。さまざまなAI分野でも...

...

科学者は、指示に従って芸術作品を制作する「絵画」ロボットの群れを作った

ほとんどの人が協働型群ロボットを想像するとき、通常は捜索救助活動などの用途を思い浮かべます。しかし、...

畳み込みニューラルネットワークが分かりませんか?怖がらないでください、このかわいい写真を​​見ればわかりますよ!

この記事では、畳み込みニューラル ネットワーク (CNN) の基本原理を、関連する数学理論を省き、最...

マスク氏はAIが人間を超えると述べ、それを信じない人は単に賢いだけだと語る

北京時間7月23日、テスラのCEOイーロン・マスク氏は水曜日、人工知能(AI)の将来についての懸念を...

AIは教育分野にどのように貢献できるのでしょうか?

調査機関Markets&Marketsの予測によると、2023年までに世界の教育業界における...