ビデオ監視産業の発展動向とAI技術の応用

ビデオ監視産業の発展動向とAI技術の応用

1. ビデオ監視産業の発展動向

わが国では、安全都市やインテリジェント交通などのさまざまな建設プロジェクトが継続的に開発され、金融、教育、不動産などさまざまな業界のユーザーのセキュリティ意識も継続的に高まっており、ビデオ監視市場は過去5年間で約18%の安定した成長を維持しています。しかし、ほとんどのカメラは従来の手動監視方式から脱却できず、大量のビデオデータが蓄積されてストレージリソースを占有したり、リアルタイムのビデオ監視が不十分だったり、ビデオの検索が困難だったりするなどの問題が発生しています。事件が発生すると、大量のカメラによってもたらされる膨大なビデオデータの検索には、多くの警察の人手が必要になります。

これらの問題を解決するために、近年、ビデオ監視業界は「高解像度、ネットワーク化、インテリジェンス化」に向けた進化を加速させています。ビデオ監視機器は高度な技術を要し、システムの革新的なアップグレードは市場需要の変化を導き、新たな市場需要を生み出しています。

  • 高解像度: カメラの高解像度は、カメラのネットワーク化とインテリジェンスを実現するための重要な前提条件です。高解像度カメラは、人間の視覚をより鮮明にするだけでなく、機械の視覚をより鮮明にするため、マシンビジョン技術が有用になり、重要で効果的な情報をより正確に抽出できるようになります。これまで、カメラの高解像度化を阻む主な理由は、帯域幅とストレージのコストでした。そのため、エンコード効率の向上が高解像度ビデオを実現するための技術的基礎となります。
  • ネットワーキング: ネットワーク通信技術の発達により、ビデオ監視システムはインターネットを介してビデオデータを遠隔送信できるようになり、遠隔監視機能が実現され、ビデオ監視の範囲が大幅に拡大しました。もちろん、ネットワークの発展傾向により、ビデオデータの量もますます大きくなり、システムにはより強力な保存、検索、バックアップ機能が求められています。同時に、膨大な量のビデオデータにより、ビデオ監視システムのインテリジェントな開発に対する要求も高まっています。
  • インテリジェンス: 近年、インテリジェントなビデオ監視技術が広く研究され、実用化されています。マシンビジョン技術をビデオ監視システムに統合することで、ビデオデータストリームに対して画像処理とターゲット分析を実行し、自動検出とターゲット追跡を実現し、ビデオ監視システムをリアルタイムで制御して、受動的な監視を能動的な監視に変えることができます。

「高解像度、ネットワーク化、インテリジェント化」のビデオ監視システムは、すでに実生活で使用され始めています。具体的には、インテリジェント交通システムでは、重要なチェックポイントのカメラが交通違反をインテリジェントに検出できます。将来的には、すべての道路交通をカバーするビデオが接続された後、都市の混雑モデルを構築し、信号や道路の運転規則をリアルタイムで調整することもできます。安全都市システムでは、各ポイントのビデオを受動的に監視するだけでなく、現地の状況に応じて安全検出アルゴリズムを実行し、事件が発生したときに積極的に警報を発し、従来の「事前抑止と事後追跡」を能動的な監視に変えることができます。民生市場では、カメラに乗客の流れの統計や顔認識などの機能を追加することで、ビデオ監視の民生市場がさらに拡大しています。

2. ビデオ監視のコア技術 - エンコード技術

現代のビデオ監視システムには、主に次の 5 つの主要テクノロジーのカテゴリが含まれます。

  • デジタルビデオ圧縮および符号化技術(符号化)
  • デジタル映像のネットワーク伝送技術(伝送)
  • 大容量ビデオデータの保存および検索技術(ストレージ)
  • ビデオ監視シーンにおける人物・物体の識別・追跡技術(ビデオ画像処理・解析)
  • ビデオ監視シナリオにおけるモーション検出およびアラーム技術(ビデオ画像処理および分析)

最初の 3 つはコア サポート テクノロジです。膨大な量のビデオ データと限られたストレージおよびネットワーク伝送リソースの間の矛盾により、ビデオ エンコーディングはビデオ監視システムで最も重要なコア テクノロジになりました。

国際電気通信連合の電気通信標準化部門 ITU-T と国際標準化機構および国際電子委員会 ISO/IEC は、ビデオ コーディング標準を開発する 2 つの主要組織です。ITU-T の標準には H.261、H.263、H.264 があり、主にテレビ会議などのリアルタイム ビデオ通信で使用されます。MPEG シリーズの標準は、国際標準化機構および国際電子委員会 ISO/IEC によって開発され、主にビデオ ストレージ (DVD)、ラジオやテレビ、インターネットやワイヤレス ネットワーク上のストリーミング メディアなどで使用されます。両組織は、MPEG-2 ビデオ コーディング標準と同等の H.262 標準など、いくつかの標準も共同で開発しました。現在、ビデオ通信では H.261 と H.263 が広く使用されています。H.264 規格の導入は、ビデオ コーディング規格における重要な進歩です。MPEG-2、MPEG-4、H.263 と比較して、コーディング効率が高くなります。しかし、コーディング効率が高くなるということは、コーディングアルゴリズムがより複雑になるということでもあります。集積回路技術の急速な発展により、H.264 の応用が現実のものとなりました。

現在、最新の国際ビデオ規格はH.265です。同じ鮮明度で、H.265ビデオ規格のビットレートはH.264の半分であり、伝送と保存の効率が大幅に向上します。大手メーカーもH.265規格に基づいて、より効果的なエンコードアルゴリズムをリリースしています。たとえば、HikvisionがリリースしたSmart265は、さまざまなシナリオに合わせて異なるビットレートを設定できます。トラフィックがまばらなシナリオでは、ビットレートを70%以上削減できます。効率的なコーディングアルゴリズムの出現により、高解像度の伝送コストが削減され、高解像度がインテリジェンスの基盤を築きました。

図: コーディング技術の効率比較

出典: Hikvision公式サイト

3. ビデオ監視におけるAIの応用

中国セキュリティネットワークの統計によると、2016年に中国の高解像度カメラの在庫の割合は47%に増加し、2017年には標準解像度カメラを超える予定です。2016年、中国のネットワークカメラの在庫の割合は40%に達し、今後も急速に成長し、アナログカメラに取って代わるでしょう。

図: 中国のハイビジョンカメラ在庫シェア

出典:中国安全保障ネットワーク

図: 中国のネットワークカメラ在庫シェア

出典:中国安全保障ネットワーク

アップグレードされたカメラは、鮮明なビデオ画像をリアルタイムでバックエンドに送信できるだけでなく、大量の非構造化ビデオデータも提供します。そのため、AI アルゴリズムを使用して非構造化データを構造化データに変換し、インテリジェントな分析を行うことが、ビデオ監視業界が直面する主要な課題となっています。データ処理の効率を向上させると同時に、さまざまなアプリケーション シナリオでデータの価値を最大限に活用することもできます。たとえば、顔認識は現在、インテリジェント アプリケーションで最も広く使用されているテクノロジーです。現在、ディープラーニングに基づく顔認識アルゴリズムにより、容疑者の捕捉からその画像をバックエンド システムに送信して比較および警告するまでに、わずか数秒しかかかりません。

ビデオ画像処理と分析技術は、インテリジェント監視を実現するための鍵です。現在、主なセキュリティパターン認識技術には、身元認識、軌跡認識、環境判断と補償認識などがあります。

出典: セキュリティナレッジネットワーク

ビデオ監視システムで AI 技術を使用するには、フロントエンドとバックエンドの 2 つのソリューションがあります。前者はフロントエンド カメラ独自のチップとアルゴリズムを使用して計算を行い、後者はバックエンド コンピューターを使用して分析を行います。

(1)フロントエンドソリューション:カメラなどのフロントエンドデバイスに内蔵されたAI分析チップの使用を指します。フロントエンドのインテリジェント分析により、送信する必要があるデータの量を効果的に削減できます。ナンバープレート認識などのアプリケーションでは比較的成熟しており、フロントエンドデバイスによるナンバープレート認識の精度は現在99%に達しています。

(2)バックエンドソリューション:通常のカメラはビデオ情報を収集してバックエンドに送信し、バックエンドサーバーソリューションを使用してインテリジェント分析を行います。これは現在主流のインテリジェント分析ソリューションであり、主にCPU + GPUアーキテクチャを採用しています。GPUクラスターサーバーは、複数のGPUの並列処理機能を最大限に活用して、ビデオ構造化処理の効率を効果的に向上させます。

フロントエンドソリューションでは、多数の AI カメラの導入と既存のカメラの大規模な交換が必要となり、多大なコストがかかります。さらに、フロントエンド機器はサイズが小さく、チップの小型化に対する要求も高く、チップのコストはバックエンド機器の約2倍です。短期的なコスト圧力により、AI機能は依然として主にバックエンドに集中しています。 AIバックエンド製品は強力なコンピューティング性能を備えており、1台のスマートNVRで数十台のカメラのデータを同時に分析し、特徴抽出や顔認識などの機能を実現できます。

ただし、フロントエンドのインテリジェンスはビデオ監視の適時性を高めることができ、フロントエンドに AI 機能を統合すると、ビデオ情報をアップロードするための帯域幅の負荷を軽減できます。フロントエンド処理チップの性能が継続的に向上するにつれて、AIカメラはより複雑なアルゴリズムを実行できるようになります。長期的には、フロントエンドのインテリジェント分析も将来の開発トレンドの1つになるでしょう。

このサブスクリプション アカウントは、業界情報や研究経験を交換するためのものであり、商業目的ではありません。いかなる状況においても、このサブスクリプション アカウントで表現される情報または意見は、誰かに対する投資アドバイスを構成するものではなく、サブスクリプション アカウントによって公開されるコンテンツに基づいて投資決定を行うことで生じる可能性のあるすべてのリスクは、加入者が負う必要があります。このサブスクリプションアカウント内のテキストと画像の一部はインターネットからのものです。 侵害の問題がある場合は、すぐにご連絡ください。適時に対処いたします。

<<:  ビデオシーンにおける人工知能アプリケーションの現状を探る

>>:  予想外! AI技術はアダルト動画サイトに成熟して適用されている

ブログ    
ブログ    

推薦する

機械学習情報工場になるためには、企業はリーン製造からこれらの6つの基本を学ぶ必要がある

【51CTO.com クイック翻訳】調査機関Forrester Researchが最近発表した調査レ...

新しいマイクロ液体ロボット:「食べ物」がある限り、連続的かつ自律的に動作可能

ロボットといえば、おそらくR2-D2やC-3POのイメージが思い浮かぶでしょう。しかし、ロボットは大...

遺伝的アルゴリズムの動作原理を 1 つの記事で理解する (Python 実装付き)

最近、「遺伝的アルゴリズムの紹介とデータ サイエンスにおけるその応用」というタイトルの記事が Ana...

機械学習の謎を解く: プログラムはどのようにして自分自身を作成するのか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

Microsoft の 6 ページの論文が話題に: Ternary LLM、とてもクール!

これはマイクロソフトと中国科学院大学による新たな研究の結論です。すべての LLM は 1.58 ビッ...

いつ表面的に調べ、いつ深く掘り下げるべきか - 機械学習は1ページで説明できるものではありません

機械学習、ディープラーニング、人工知能の台頭は議論の余地のない事実となり、コンピュータサイエンスの分...

AI時代のネイティブ:3歳でパズルを作り、5歳でプログラミングを学ぶ

[[241540]] 2018年世界ロボットコンテストで、子どもたちがロボットのプログラミングと制御...

AirPodsは「あなたの脳を読む」ことができるのか?あるいは汗中の乳酸濃度も監視できるタイプ|ネイチャー

AirPods は脳の信号を監視できますか? !それともアルツハイマー病やパーキンソン病を予測できる...

...

英国、今年末までに無人運転車の公道走行を許可へ

4月29日、外国メディアの報道によると、英国運輸省は水曜日、自動車線維持システム(ALK)を搭載した...

人工知能技術の高みを突破するための知恵を集め、上海勝思AIフレームワーク&ビッグモデルイノベーションセンターが正式に発足

2023年6月16日、「共に立ち上がって無限のイノベーションを」をテーマにした人工知能フレームワーク...

人工知能は地球規模の気候危機に対処するために何ができるでしょうか?

インフレは世界的な問題であり、気候変動によって悪化しています。これは、異常気象の頻度と深刻度が増した...

MLP および Re-Parameter シリーズに関する人気の論文を含む、注目メカニズムの 17 個の PyTorch 実装

[[415286]]注意メカニズムは、最初はコンピューター ビジョンで使用され、その後 NLP の分...

今後10年間で、人間の仕事の約50%が人工知能に置き換えられるでしょうか?

人工知能と聞いて真っ先に思い浮かぶのは、手を自由にすることですが、絶対的に正しいものはありません。手...

アクセンチュアが世界の主要12産業を分析、AIは2035年までに中国に7兆ドルの生産をもたらす

導入世界的に有名なコンサルティング会社であるアクセンチュアは最近、AI がもたらす産業革新がもたらす...