人工知能がハイパー監視を推進

人工知能がハイパー監視を推進

私たちは通常、監視カメラを、見方によっては私たちを監視する、あるいは私たちに代わって監視するデジタルの目だと考えています。しかし、実際には、それらは舷窓のようなもので、誰かが覗いている場合にのみ役立ちます。これは、誰かが監視ビデオを視聴していることを意味する場合があり、多くの場合、複数のビデオ ウィンドウが同時に表示されます。しかし、ほとんどの監視カメラは受動型です。それらは抑止力として、または何か問題が起こった場合に証拠を提供するために存在します。

[[220170]]

しかし、状況は急速に変化しています。人工知能は監視カメラに人間の目に匹敵する脳を与え、人間の介入を必要とせずにリアルタイムのビデオを分析できるようにします。これは公共の安全にとって朗報となり、警察や緊急対応要員が犯罪や事故をより簡単に検出するのに役立つほか、科学的、産業的な用途も多岐にわたります。しかし、これはプライバシーの将来について深刻な疑問を提起し、社会正義にまったく新しいリスクをもたらします。

もし政府がCCTVビデオ監視を使って多数の人々を追跡できたらどうなるでしょうか?もし警察があなたの顔写真をデータベースにアップロードするだけで、街中であなたをデジタル的に追跡できるとしたらどうなるでしょうか?あるいは、地元のショッピングモールのカメラで実行されているアルゴリズムが偏っていて、特定の若者のグループの見た目が気に入らないというだけの理由で警察を呼ぶために警報を鳴らしたらどうでしょうか?

こうしたシナリオが実現するまでには時間がかかるかもしれませんが、監視と人工知能を組み合わせた初期の結果はすでに現れています。 IC Realtime がその一例です。同社の主力製品は昨年12月に発売され、Googleの閉回路テレビビデオ監視に使用されている。これは、人工知能を使用してビデオストリーム内のコンテンツを分析し、即座に検索できるようにする、Ella と呼ばれるアプリと Web プラットフォームです。 Ella は何千もの自然言語クエリを認識できるため、ユーザーは映像内のコンテンツを検索し、特定の動物、特定の色の服を着た人物、さらには特定のメーカーやモデルの自動車を含むクリップを見つけることができます。

ウェブベースのデモンストレーションで、IC Realtime の CEO である Matt Sailor 氏は、工業団地を監視する約 40 台の監視カメラに接続された Ella のバージョンを The Verge に紹介しました。彼は「赤い服を着た男」「UPSのトラック」「パトカー」などさまざまな検索語を入力し、数秒以内に関連映像を表示した。次に、時間の範囲と場所の範囲を絞り込み、Netflix と同じようにユーザーが親指で上下にスワイプして結果を絞り込むことができる点を指摘しました。

AI監視は検索可能なビデオから始まる

「強盗事件が起きたら、何が起こっているのか本当に分からない」とセイラー氏は語った。 「しかし、ジープ・ラングラーが東へ猛スピードで走り去っていくのが見えた」と彼は語った。「そこで『ジープ・ラングラー』を検索したら、そこにあった」。画面には、カメラの前を通り過ぎるさまざまなジープ・ラングラーのビデオクリップが映し出され始めた。セイラー氏は、AIとCCTVビデオ監視を組み合わせることで、探しているものを簡単に見つけられるようになることが最大の利点だと説明した。 「この技術がなければ、カメラのことしか分からないし、何時間も何時間もビデオを精査しなければならない」と彼は語った。

Ella は Google Cloud 上で実行され、ほぼすべての CCTV ビデオ監視システムの映像を検索できます。 「ベビーシッター用カメラや犬用カメラのような 1 台のカメラから、何万台ものカメラを備えたエンタープライズ レベルのシステムまで、あらゆるシステムでうまく機能します」とセイラー氏は語った。ユーザーは月額利用料を支払う。料金は 1 か月あたり約 7 ドルから始まり、カメラの数に応じて増額される。

IC Realtime はあらゆる規模の企業をターゲットにしたいと考えていますが、同社の技術は個人消費者にも魅力的であると考えています。これらの顧客は、アマゾン、ロジテック、ネットギア、グーグル傘下のネストなどの企業が製造する「スマート」ホームセキュリティカメラの急成長市場によって十分にサービスを受けてきた。しかし、セーラー氏は、この技術は IC リアルタイムの技術に比べると粗雑すぎると述べた。カメラは自宅の Wi-Fi に接続し、アプリ経由でライブビデオストリームを提供し、動きを検出すると自動的にビデオを録画します。しかし、侵入者と鳥の区別がつかず、誤報が多く発生しているとセイラー氏は語った。 「これらは何年も前からある非常に基本的な技術です」と彼は言う。「ここには人工知能もディープラーニングもありません。」

これは長くは続かないでしょう。 IC Realtime は、既存のコンパクトカメラをアップグレードできるクラウドベースの分析機能を提供していますが、他の企業はハードウェアに AI を直接追加しています。そうしたスタートアップ企業の 1 つが Boulder AI で、同社は独自のスタンドアロン AI カメラを使用して「サービスとしてのビジョン」を販売しています。 AI をデバイスに統合する大きな利点の 1 つは、動作するためにインターネット接続を必要としないことです。 Boulder は幅広い業界に販売しており、各顧客に合わせてマシン ビジョン システムをカスタマイズしています。

「アプリケーションは本当に包括的です」と同社の創設者ダレン・オドム氏はザ・ヴァージに語った。「私たちは銀行やエネルギー会社にプラットフォームを販売しています。ピザを見て、適切なサイズと形かどうかを判断するアプリケーションもあります。」

「現在、アイダホ州のマスを100%識別できるようになっています。」

オドム氏はアイダホ州でダムを建設していた顧客の例を挙げた。環境規制を遵守するため、このインフラの上を移動できる魚の数を監視しています。 「以前は、窓際に座って魚道を監視し、何匹のマスが泳いでいくかを数える人がいました」とオドム氏は言う。(魚道とは、その名の通り、魚が苦労して上っていく階段状の水路のことである。)「その後、ビデオ技術を導入し、(遠隔で)監視する人がいました」。最終的に、彼らはボルダーの会社に連絡し、魚道を通る魚の種類を識別するためのカスタム CCTV システムを構築してもらいました。 「コンピュータービジョンを使用することで、魚種の識別を次のレベルに引き上げることができました」とオドム氏は誇らしげに語る。「現在、アイダホ州のマスを 100 パーセント識別できるようになりました。」

IC Realtime が市場の汎用性を代表しているのに対し、ボルダーの会社はブティック請負業者が何ができるかを実証しています。しかし、どちらの場合も、これらの企業が現在提供できるのは氷山の一角にすぎません。機械学習が物体を認識する能力において急速に進歩したのと同様に、シーン、活動、行動を分析する能力も急速に向上すると予想されます。基礎研究、コンピューティング能力、トレーニング データ セットなど、優れた AI を作成するための重要な要素がすべて整っています。動画分析のための2大データセットはYouTubeとFacebookから提供されており、両社とも自社のプラットフォーム上のコンテンツの管理にAIが役立つことを期待していると述べている(ただし、両社ともまだ準備ができていないことを認めている)。たとえば、YouTube のデータセットには、45 万時間を超えるラベル付きビデオが含まれており、「ビデオ理解の革新と進歩」を促進することが期待されています。このようなデータセットの構築に関与している組織の広さから、この分野の重要性がうかがえます。 Google、MIT、IBM、DeepMind も参加し、それぞれ同様のプロジェクトを立ち上げました。

IC Realtime はすでに顔認識などの高度なツールを開発しています。その後、画面上で何が起こっているかを分析できるようになることを期待しています。セイラー氏は、学校で生徒が問題を起こした時にそれを特定できる監視システムを望んでいる教育分野の潜在的顧客と話をしたと語った。 「例えば、生徒たちは喧嘩の速やかな通知に関心があります」と彼は言う。システムがやるべきことは、生徒たちが集まっていることに気付き、誰かに警告を発して、ビデオ映像で何が起こっているのか確認したり、直接調べに行ったりすることだけだ。

イリノイ州ボルダーに本拠を置く同社も、この種の高度な分析を研究している。同社が開発中のプロトタイプシステムの一つは、銀行における人間の行動を分析することを目的としている。 「私たちは特に悪質な行為者を探し、普通の人の行動と一線を越えた人の行動の違いを検出します」とオドム氏は言う。そのために、彼らは古い防犯カメラの映像を使って、異常な行動を見つけられるようにシステムを訓練している。しかし、これらのビデオの多くは品質が非常に低いため、独自のトレーニングビデオクリップを撮影する俳優も探しています。オドム氏は詳細には触れなかったが、このシステムは特定の表情や行動を探すものだと語った。 「私たちの俳優たちは、しゃがんだり、押したり、肩越しに見たりするようなことをします」と彼は言った。

監視と人工知能の専門家にとって、これらの機能の導入は潜在的な技術的および倫理的困難をはらんでいます。そして、AI の場合よくあることですが、これら 2 つの難易度のカテゴリは相互に関連しています。機械が人間と同じように世界を理解できないというのは技術的な問題ですが、機械が理解できると仮定して、人間に代わって決定を下させると、道徳的な問題になります。

この種のコンピューター分析を専門とするカーネギーメロン大学のアレックス・ハウプトマン教授は、近年この分野で人工知能が大きく進歩しているものの、コンピューターにビデオを理解させるにはまだ非常に基本的な問題があると述べた。最も大きな問題の 1 つは、あまり意識されなくなったカメラの問題、つまり解像度です。

最大の障害は非常に一般的です:低解像度のビデオ

たとえば、ニューラル ネットワークをトレーニングして、ビデオ内の人間の行動を分析することができます。これらは、人体を腕、脚、肩、頭などの部分に分解し、ビデオのフレームごとにこれらの小さな部分がどのように変化するかを観察することによって機能します。こうすることで、AI は誰かが走っているのか、髪をとかしているのかを判断できるようになります。 「しかし、それはあなたが持っているビデオの解像度に依存します」とハウプトマン氏はThe Vergeに語った。「駐車場の端にカメラを向けた場合、誰かが車のドアを開けたかどうかがわかればラッキーです。カメラの真正面に立ってギターを弾いていれば、指の動きをすべて追跡できます。」

これは、カメラの映像が粗くなりがちで、角度がおかしくなることが多い CCTV 監視システムでは大きな問題です。ハウプトマン氏は、レジを監視するために設計されたコンビニエンスストアのカメラを例に挙げたが、このカメラは通りに面した窓も監視している。外で強盗事件が発生し、カメラの視界の一部が遮られている場合、AI が動けなくなる可能性があります。 「しかし、人間は何が起こっているのかを想像し、それをつなぎ合わせることができる」と同氏は言う。「コンピューターにはそれができない」

同様に、AI はビデオ内の関連するイベント(たとえば、誰かが歯を磨いている、携帯電話を見ている、サッカーをしているなど)を識別するのが得意ですが、重要な因果関係を抽出することはできません。たとえば、人間の行動を分析するニューラル ネットワークを考えてみましょう。映像を見て「この人は走っています」と言うことはできるが、バスに乗り遅れたために走っているのか、誰かの携帯電話を盗んだために走っているのかは分からない。

正確性に関するこれらの疑問は、一部の AI スタートアップ企業の主張について慎重に考えるきっかけとなるはずです。コンピューターがビデオを見るだけで人間と同じ洞察を得られるようになるまでには、まだ程遠い。 (研究者は、これは基本的に知能問題を「解決する」ことと同義なので、実行するのは非常に難しいと言うでしょう。)しかし、物事は非常に急速に進んでいます。

ハウプトマン氏は、ナンバープレート追跡による車両追跡は「解決済みの本当の問題」であり、管理された環境での顔認識でも同じことが言えると述べた。 (低品質の CCTV 映像で顔認識を行うのはまったく別の問題です。) 車や衣服などの物体の識別も非常に信頼性が高く、複数のカメラで人物を自動的に追跡することも可能ですが、条件が適切である場合に限られます。 「混雑していない場所で人物を追跡するのは非常にうまくいくかもしれないが、混雑した場所では無理だ」とハウプトマン氏は言う。人物が目立たない服を着ている場合は特に難しいと同氏は言う。

AI監視タスクの一部は解決されているが、他のタスクにはさらなる作業が必要である。

しかし、これらの非常に基本的なツールでも、非常に強力な効果をもたらす可能性があります。例えばモスクワでは、市内のアパートの入り口の90%以上をカバーする10万台以上の高解像度カメラの集中システムに顔認識ソフトウェアを組み込む同様のインフラが構築されつつある。

この場合、ソフトウェアが改善されるにつれて、システムがより多くのデータを収集し、それがソフトウェアの改善に役立つという好循環が生まれる可能性があります。 「すべては改善されると思います」とハウプトマン氏は言う。「今、それが起こりつつあります」

これらのシステムがすでに機能していたら、アルゴリズムによる偏りなどの問題がすでに発生していたはずです。これは仮説的な挑戦ではありません。研究によると、機械学習システムは、それをプログラムする社会の人種差別や性差別を吸収する。その例としては、女性を常にキッチンに配置する画像認識ソフトウェアから、黒人は再犯する可能性が高いと常に告げる刑事司法制度までが挙げられる。 CCTVや警察のボディカメラの映像など、古いビデオクリップをAI監視システムのトレーニングに使用すると、社会に存在する偏見が永続化される可能性があります。

ニューヨーク大学(NYU)の倫理に重点を置いたAIナウ研究所の共同所長メレディス・ウィテカー氏は、このプロセスはすでに法執行機関で行われており、民間部門にも拡大されるだろうと述べた。ウィテカー氏は、ビデオ分析機能を自社製品に統合するために複数のAI企業を買収した、以前はテイザーとして知られていたアクソンの例を挙げた。 「彼らが持っているデータは警察のボディカメラから得たもので、個々の警察官が誰に注意を払っているかについて多くのことを教えてくれますが、全体像はわかりません」とウィテカー氏は語った。「犯罪と犯罪者について偏った見方を一般化してしまう危険性が本当にあります。」

ACLUの上級政策アナリスト、ジェイ・スタンリー氏は、たとえこれらの自動化システムの偏見に対処できたとしても、それがシステムを無害にするわけではないと述べた。同氏は、CCTVビデオ監視カメラを受動的な観察者から能動的な観察者へと変えることは、市民社会に多大な悪影響を及ぼす可能性があると述べた。

「私たちは人々に自由を与えるだけでなく、自由を感じてもらいたいのです。」

「私たちは人々に自由を与えるだけでなく、自由を感じてほしいのです。つまり、人々は自分の行動や言葉のすべてを、知られざる目に見えない観客がどう解釈するか、あるいは誤解するかを心配する必要がないということです」とスタンリー氏は言う。「心配なのは、人々が自分の行動すべてが誤解され、人生に悪影響が出るのではないかと心配し、常に自分自身を監視するようになることです」

スタンリー氏はまた、不正確なAI監視による誤報が法執行機関と一般市民の間のより危険な対立につながる可能性もあると述べた。例えば、ダニエル・シェーバー射殺事件を考えてみましょう。この事件では、シェーバーが銃を持っているのを見た警察官がテキサス州のホテルの部屋に呼び出されました。チャールズ・ラングレー保安官は、シェーバーが要求通りに地面に伏せたときに彼を射殺した。シェーバー容疑者が所持していた銃はペレット銃で、彼はそれを害虫駆除の仕事に使用していた。

人間がこのような間違いを犯す可能性があるのなら、コンピューターにチャンスはあるのでしょうか?また、監視システムが部分的に自動化された場合、このようなエラーはより一般的になるのでしょうか、それともより少なくなるのでしょうか? 「もし技術が存在するなら、それを管理しなければならない警察官もいるだろう」とスタンリー氏は語った。

AI 監視が一般的になったとき、これらのアルゴリズムを誰が管理するのでしょうか?

ウィテカー氏は、この分野で私たちが目にしているのは、比較的粗雑なツールを使って外見に基づいて人を分類しようとする人工知能の大きなトレンドの一部だと語った。彼女は同様の例として、顔認識によって性的指向を判断できると主張する昨年発表された物議を醸した研究を挙げた。人工知能によってもたらされる結果の正確さは疑問視されているが、批評家はそれが機能するかどうかは重要ではなく、人々がそれが機能すると信じているかどうか、そして依然としてデータを使って判断しているかどうかが重要だと指摘している。

「こうしたシステムの多くが、その有効性について疑問を投げかけたり、導入されていることを国民に知らせたりする民主的なプロセスなしに、わが国の基幹インフラに導入されていることに私は困惑している」とウィテカー氏は述べた。「これは、文化的、歴史的な偏見を含むデータから抽出されたパターン認識に基づいて、アルゴリズムシステムが分類や個人のタイプ識別を行う例のひとつにすぎない」

IC Realtime に AI 監視がどのように悪用される可能性があるか尋ねたところ、テクノロジー業界ではよくある答えが返ってきました。つまり、これらのテクノロジーは価値中立であり、それが良いか悪いかは、どのように、誰によって使用されるかによってのみ決まる、というものです。 「どんな新しい技術でも、悪意ある者の手に渡るリスクがある」とセイラー氏は言う。「それはどんな技術にも言えることだ。そして今回の場合は、メリットがデメリットをはるかに上回ると思う」

<<:  今後10年間の主要な投資の方向性を予測して、あなたは未来に向けて準備ができていますか?

>>:  2018年ニューリテール5大トレンド:無人小売が広がり続け、人工知能やIoTが新たな価値を創出

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

AI企業がソフトウェアサプライチェーンの脆弱性の犠牲になると何が起こるか

OpenAI の侵害を調査し、AI 企業 SSC のハッキングの可能性とその影響の可能性を推測します...

自動運転車がコーナーを「見通し」できるようにする

自動運転車がその名に恥じない性能を発揮するには、満たすべき要件が数多くありますが、環境の認識と理解が...

過去 2 週間で AI の進路を変える可能性が最も高い 6 つのリリース!

編纂者:ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:blog)過去 2 ...

...

データが少ないとディープラーニングは使えないなんて誰が言ったのでしょうか?私はこのことについて責任を負わないよ!

ある観点から見ると、激しい競争は業界の人気を示しています。最近、人気のディープラーニングも論争を引き...

将来のビジネスインテリジェンスにおける人工知能の役割

AI 搭載のチャットボットを導入しているコールセンターから、ディープラーニングを使用して数え切れない...

20世紀の最も偉大なアルゴリズム10選

参考: 20 世紀のベスト: 編集者が選ぶトップ 10 アルゴリズム。著者:バリー・A・シプラ。アド...

百度の于有平氏:すべての開発者が平等かつ便利にAI機能にアクセスできるようにする

「すべての開発者が平等かつ便利にAI機能にアクセスできるようにするのが、私たちのビジョンであり、コミ...

NetEase Cloud Musicのリアルタイムデータウェアハウスガバナンス最適化の実践

1. 現状と問題点1. 現状と問題点Cloud Music データ ウェアハウス プラットフォームは...

...

AI、自動化、仕事の未来、そして注目と解決が必要な問題

職場で機械が人間の労働力を補うようになるにつれ、私たち全員がその恩恵を受けるために適応する必要があり...

再トレーニングなしでモデルを6倍圧縮:数学者チームが新しい量子化法を提案

RUDN大学の数学者チームは、再トレーニングに余分なリソースを費やすことなく、ニューラルネットワーク...

ディープラーニングモデルを本番環境に簡単に導入

[51CTO.com クイック翻訳] データから学習し、パターンを識別し、人間の介入を最小限に抑えて...

大規模ディープラーニングツールの最新動向を詳しく見る

Panos Labropoulos 博士は、Bright Computing のシニア サポート エ...