コーヒーショップの監視ビデオが流出し、何百万人もの人々が視聴していた。マスク氏は「ひどい！」と叫んだ。 AIはあなたがコーヒーをどれくらい飲んだかを正確に把握しています

私たちはプライバシーがますます少なくなる世界に住んでいます。

今日、ネット上で拡散されたこのビデオは多くの人を怖がらせました。

コーヒーショップでは、各顧客が店内に数分間滞在した時間と、各ウェイターが顧客に持ってきたコーヒーのカップ数がすべてビデオで明確に表示されました。

このビデオは12時間ほど前に公開されたが、すでに100万人以上の視聴者を集めている。

この動画を投稿したネットユーザーはこう述べた。「このコンセプトは、コーヒーショップがAIを使ってバリスタと顧客を分析する方法を示しています。」プライベートなカフェ空間を存分にお楽しみください。 😂

別のネットユーザーは、これは驚くべきことではないと述べた。消費者として、多くの店舗ではあなたが店に入った瞬間にあなたのことをすべて知っているということを知っておくべきです。

それに比べれば、ケンブリッジ・アナリティカ事件は見劣りする。

（2018年、フェイスブックは、英国のデータ分析会社が2016年にフェイスブックのユーザー5000万人の情報を違法に入手し、その情報を使って投票結果を予測し影響を与えるソフトウェアプログラムを構築し、トランプ大統領の勝利を助けたことを認めた。）

コメント欄にはマスク氏自身も現れ、感嘆符を2つ続けて付けた。

AIがカフェの従業員や顧客をスパイするという考えが十分に恐ろしいと思うなら、コストを考慮に入れなければ、空には何千ものドローンがいて、リアルタイムの追跡データを規制当局に送信し、すべてが追跡され、記録される可能性があるというのが現実です。

現在の物体検出および画像認識技術は非常に強力なので、専門部門さえ必要ありません。誰でもアマチュアのドローンで追跡を行うことができます。

数年前、個別のグラフィックカードで 1080p ストリーミングを実行する場合、最大容量は 6 オブジェクトのみであったことを知っておく必要があります。

どこにでも目がある

現実には、今日の世界はカメラで溢れています。

これらの企業の多くは、AIとビデオフィードの視覚認識を駆使して、消費者を追跡するための非常に秘密裏な戦略を展開しています。

たとえば、ウォルマートのスマートリテールラボでは、IRL センサーとカメラにより、スタッフが店舗内のすべての情報を把握できます。

ファーストフード店も従業員の監視にAI技術を導入している。ここでは従業員にマスクの着用が義務付けられており、誰かがマスクを外すと、管理者はすぐに気付きます。

さらに、当社のモバイル位置情報データも販売されています。

ほぼすべての携帯電話事業者は、小売店に匿名でデータを販売しており、これは事業者の主要事業の一部であると言えます。

「オペレーター名 + クラウドインサイト」を Google で検索するだけで、結果に驚かれることでしょう。

「特定の時間に特定の場所を何人の人が通過するかを知りたいですか？彼らの年齢や収入状況は？彼らのうち何人が潜在顧客になるか？」

もちろん、「Crowd Insights」サービスでは、データが匿名であり、データの収集方法によって個人のプライバシーが漏洩することはないということを強調します。

「私のデータが収集されたら、会社に支払いを求めることはできますか？」と言う人もいます。

企業で使用されているカメラに関して、コメント欄で次のような経験談をシェアした人がいました。

「私はスタジアムのバックエンドのセキュリティカメラシステムに携わっていますが、私たちが公開しているのは実際のデータの3分の1だけです。」

「まるで映画のように、顔を近づけるとシステムがあなたの居場所を知らせてくれます。」

これを実現するために必要なのは、任意のウェブカメラを用意し、300 ドルのソフトウェアをインストールし、ディスク容量がなくなるまで実行するだけです。

長所と短所は？

この点に関して、AIコンサルティングの専門家であるDiego San Esteban氏は次のように見解を述べています。

彼は、AI モニタリングには、従業員のパフォーマンスと生産性を継続的にモニタリングし、管理者がより適切な戦略を策定できるなど、多くの利点があると考えています。

さらに、AI は客観的なパフォーマンスデータを提供して、評価における人間の偏見を回避することもできます。

デメリットも数多くあります。最も批判されるのは、もちろん従業員のプライバシー権の侵害です。また、社内に不信感を生み、士気や仕事の満足度にも影響を及ぼします。

AI は、作業が行われている状況を完全に理解できず、人間的な共感力も欠いています。

さらに、トレーニングデータに内在するバイアスによって間違いが発生したり、影響を受けたりする可能性が高く、これは従業員にとって非常に不公平です。

物体検出アルゴリズム

実際、この物議を醸した事件の背後には、非常に一般的な AI 技術である物体検出があります。

たとえば、街路の写真が与えられた場合、オブジェクト検出モデルは、画像内のさまざまなオブジェクト（信号機、車両、道路標識、建物など）の注釈またはラベルのリストを返します。

これらのラベルには、「人物」などの各オブジェクトの適切なカテゴリと、オブジェクトを完全に囲む長方形の領域である「境界ボックス」が含まれます。

産業アプリケーション

物体検出は人間にとって非常に重要なタスクです。新しい部屋やシーンに入るとき、私たちの最初の反応は、そこにある物体や人を視覚的に評価し、理解することです。

人間と同様に、物体検出はコンピュータが視覚世界を理解して対話できるようにする上で重要な役割を果たしており、多くの業界で広く使用されています。

- サイトの安全性:

オブジェクト検出モデルは、職場の安全性とセキュリティの向上に役立ちます。たとえば、機密エリアにおける不審な人物や車両の存在を検出できます。さらに革新的なのは、作業員が手袋、ヘルメット、マスクなどの個人用保護具（PPE）を確実に使用できるようにすることだ。

- ソーシャルメディア:

オブジェクト検出モデルは、デジタルメディア内の特定のブランド、製品、ロゴ、または人物の存在を識別するのに役立ちます。広告主はこの情報を使用してデータを収集し、ユーザーにより関連性の高い広告を表示できます。また、不適切または禁止されているコンテンツを検出してフラグを付けるプロセスを自動化するのにも役立ちます。

- 品質管理:

オブジェクト検出モデルにより、視覚データの自動レビューが可能になります。コンピュータとカメラはデータをリアルタイムで分析し、視覚情報を自動的に検出して処理し、その重要性を理解することができるため、継続的な視覚的な確認を必要とするタスクにおける人間の介入を減らすことができます。これは製造生産の品質管理に特に役立ちます。効率が向上するだけでなく、人間の目では気付かない可能性のある生産上の異常も検出できるため、生産の中断や製品のリコールの可能性を防ぐことができます。

初めて66 APに到達し、最強のSOTAアルゴリズムがリストのトップに

現在、ターゲット検出アルゴリズムの性能に関しては、国内チームの「DETRs with Collaborative Hybrid Assignments Training」が最大66 APのスコアでCOCOリストのトップを占めています。この研究はICCV 2023に採択されました。

この論文では、著者らは、多様なラベル割り当て方法からより効率的で効果的な DETR ベースの検出器を学習できる、新しい共同ハイブリッド割り当てトレーニングスキームである Co-DETR を提案しました。

複数の並列補助ヘッド（ATSS や Faster RCNN などの 1 対多のラベル割り当てによって監視）をトレーニングすることにより、新しい Co-DETR はエンドツーエンド検出器のエンコーダーの学習能力を簡単に向上させることができます。

追加のカスタマイズされた正のクエリのためにこれらの補助ヘッドから正の座標を抽出することにより、Co-DETR はデコーダー内の正のサンプルのトレーニング効率も向上させることができます。

さらに、推論中にこれらの補助ヘッドは破棄されるため、この方法では元の検出器に追加のパラメーターや計算コストが導入されず、手動の非最大抑制 (NMS) も必要ありません。

論文アドレス: https://arxiv.org/abs/2211.12860v5

プロジェクトアドレス: https://github.com/Sense-X/Co-DETR

- エンコーダの最適化:

トレーニングスキームでは、1 対多のラベル割り当てによって監視される複数の並列補助ヘッドをトレーニングすることにより、エンドツーエンド検出器のエンコーダの学習能力を簡単に向上できます。

- デコーダーの最適化:

これらの補助ヘッドから正の座標を抽出することにより、追加のカスタマイズされた正のクエリが実行され、デコーダーの注意学習が改善されます。

- SOTAパフォーマンス:

ViT-L（304Mパラメータ）を搭載したCo-DETRは、COCOテスト開発で66.0%のAPを達成した最初のモデルです。

実験結果によると、Swin-L バックボーンネットワークに基づく Co-DETR メソッドにより、既存の SOTA モデル DINO-Deformable-DETR のパフォーマンスが 58.5% から 59.5% に向上します (COCO 検証セット)。

ViT-L バックボーンネットワークのサポートにより、Co-DETR は COCO テスト開発で 66.0% AP、LVIS 検証セットで 67.9% AP を達成しました。

さらに、Co-DETR は、従来の方法と比較して、より小さなモデルサイズでより優れたパフォーマンスを実現します。

<<: ボストン大学の「Platypus-70B」がHugging Face大型模型ランキングでトップに！効率的なデータセットと独自のLoRA微調整が鍵

>>: AIGC: 将来は誰が支払うのでしょうか?

コーヒーショップの監視ビデオが流出し、何百万人もの人々が視聴していた。マスク氏は「ひどい！」と叫んだ。 AIはあなたがコーヒーをどれくらい飲んだかを正確に把握しています

どこにでも目がある

長所と短所は？

物体検出アルゴリズム

産業アプリケーション

初めて66 APに到達し、最強のSOTAアルゴリズムがリストのトップに

CLIP と LLM を使用したマルチモーダル RAG システムの構築

人工知能の出現は教育にどのような影響を与えるのでしょうか?

アルゴリズムは偏っているか?他の人よりも優れていればいいのです！

OpenAIのチップ製造計画が明らかに！独自のAIチップを開発する計画があり、買収対象を検討中

ミストラルAIの新モデルはGPT-4をベンチマークしており、オープンソースではなくマイクロソフトと協力、ネットユーザー：当初の意図を忘れた

専門家の意見: AIアプリケーションでは、ビッグデータよりもワイドデータが価値がある

機械学習について学びたい方はこちらをご覧ください。1ステップで専門家になる方法をお教えします！

マシンビジョンは人工知能の次のフロンティアとなる

推薦する

3大分野で需要が解放され、2021年には検査ロボットの開発が期待される

スポーツと人工知能が出会うとき（スポーツレビュー）

シリコンバレーのAI界で注目の記事：ジャスパーとVCはAIGCブームの最大の敗者となり、潮が引いた後に初めて誰が裸で泳いでいるかがわかる

AI を活用した会話型顧客体験の可能性を引き出す方法

AI専用SoCチップのIP要件の分析

2021年世界人工知能会議の結論によって、どのような新しいトレンドが明らかになるのでしょうか?

人工知能が私たちの日常生活を変える5つの方法

北京冬季オリンピックのブラックテクノロジーが開会式から暴露された！日本のネットユーザー：人類は過去6か月間で技術の面で大きな進歩を遂げた

ビジョンと AI を追加することで、産業用ロボットはスマート製造をより効果的に支援できるでしょうか?

ディープマインドAIは人間に対して84%の勝率を誇り、ウエスタンアーミーチェスで初めて人間の専門家のレベルに到達した。

AIは金融犯罪者と戦う技術である

機械学習をよりスマートにする 5 つの成功事例