人工知能技術の発展の概要

人工知能は、コンピュータサイエンス業界のトップテクノロジーの一つとして、1956年にダートマス会議で正式に提案されて以来、さまざまな業界から注目を集めています。チューリングテストでは、人工知能の識別と判断は人間を唯一の基準としており、思考の基本的な出発点は依然としてバイオニクスです。ここには、人間は AI に限りなく近づいているが、決して限界に達することはないという暗黙の推論があります。しかし実際には、AI の登場から数十年が経過しましたが、AI はこの方向には進化していないようです。現在、特定の分野では AI の能力が人間の能力を完全に上回っていることがすでにわかっています。

1. 困難な探索：シンプルな機能、貴重な経験

実際、2016 年初頭、あるいはそれ以前に、多くの業界で潜在的な需要があり、巨大な空白市場があったころには、最先端の提案としてのインテリジェンスは、すでに多くの大規模および小規模のセキュリティ企業の PPT や特定の製品に登場していました。しかし、当時のディスプレイチップの計算能力、取得端末技術、バックエンドアルゴリズム技術、および全体的なソリューションの成熟度の限界により、この時期に推進されたアルゴリズムのほとんどは初期開発目的のものであり、実際に展開されたときにほとんどのアルゴリズムの効果が不十分でした。この時期のアルゴリズムのほとんどは、物体/人間のモデル検出に基づいており、その基本機能は、境界侵入、ライン交差アラーム、逆方向交通検出などの最も単純なイベント検出でした。そのビジネス機能と実装メカニズムは比較的単純でした。

今となっては、当時のアルゴリズム、ビジネス機能、サポートソリューションは、ほとんどが使いにくく、むしろ後進的なものであったように思われます。しかし、その時期にインテリジェントアルゴリズムの実装を模索したことで、セキュリティ業界におけるディープラーニングアルゴリズムのその後の活発な開発に、豊富なエンジニアリング経験がもたらされました。さまざまなアルゴリズム分析の厳しいシナリオ制限であれ、アルゴリズム導入時の現場調査における多様な手法や予防措置であれ、これらはすべて、初期のアルゴリズム探索者が残した貴重な経験でした。

2. 時代の潮流: セキュリティはAIにとって最適な育成の場

2016 年は人工知能業界にとって特別な年になるはずです。今年、GPU業界の絶対的リーダーであるNVIDIAは、人工知能のディープ最適化に基づく新しいPascalアーキテクチャを発表し、GTC 2016で完全なP100コアに基づくTeslaシリーズグラフィックスカード、Tesla P40とTesla P4を正式にリリースしました。同年、ディープラーニングニューラルネットワーク向けに設計された組み込みチップNVIDIA Jetson TX1もリリースしました。サーバーレベルのGPUカードとしてのP4/P40であれ、ベテランの組み込みチップとしてのTX1であれ、これら2種類のGPUは発売後、人工知能の急速な発展の年月の中で長い間、膨大なコンピューティングパワーのサポートを提供し、今年も多くのプロジェクトで見ることができます。

2016 年初頭、Google は TensorFlow のソースコードをオープンソース化し、ディープラーニングトレーニングシステムを初めて一般に公開し、その後、人工知能アルゴリズム業界全体に刺激を与えました。 TensorFlow は、登場からわずか 1 年で、100 万人を超える研究者、エンジニア、アーティスト、学生などの著しい進歩に貢献しました。 TensorFlow と、カリフォルニア大学バークレー校の Caffe、Microsoft の CNTK ネットワークなどのフレームワークに基づいて、多数の人工知能アルゴリズムが生まれ、人工知能の探求の新たな流れが始まりました。顔認識、行動分析、画像構造分析、OCR認識などの複雑な画像情報処理および抽出技術とアルゴリズムは質的に向上し、当初の探索的アプローチから成熟した信頼性の高いソリューションへと徐々に進化しています。また、多数の実用的なアプリケーションの展開を通じて、多数のサンプルトレーニングサンプルが取得され、アルゴリズム自体の進化に膨大なデータサポートを提供しています。

人工知能アルゴリズムが成熟したソリューションとなり、広く普及するためには、膨大なデータのトレーニングと実際の戦闘から得られる経験が不可欠です。他の業界がさらなる改善のための十分なリソースを確保するために奮闘する中、国は2016年に「第13次5カ年計画」を正式に発表し、「第13次5カ年計画」期間中にビデオ画像インフラストラクチャとアプリケーションシステムの構築を基本的に完了し、ビデオ画像リソースの総合アプリケーションシステムを全面的に構築し、さまざまな種類のビデオ画像リソースを統合してインテリジェントな分析と処理を行い、ソーシャルビデオリソースを安全かつ効果的に使用し、ビデオ画像の集約、共有、分析、アプリケーションを実現し、セキュリティと運用保守機能を大幅に向上させ、公安機関の各部門、警察類、その他の政府部門、社会に総合的なビデオ画像情報サービスを提供することを要求しました。同時に、ビデオ画像情報分析システムでは、ビデオコンテンツ（リアルタイムストリーム+ビデオストリーム）の構造化分析と情報抽出、および所定の戦略に従ったビデオ画像情報の比較、衝突、深層、大領域、多次元データマイニングと判断など、多数の分析要件も明確に提示されています。

第13次5カ年計画ではビデオ画像解析アルゴリズムに対する明確な要件が定められているため、第13次5カ年計画期間中に数え切れないほどのアルゴリズム構築ニーズが発生しました。あらゆるレベルのユーザーのニーズに応えるため、顔認識、ビデオ構造化、ReIDなど、人工知能に基づくディープラーニングアルゴリズムと関連アプリケーションの「テストフィールド」でのフィールド展開と演習を実施し、多数の協力的な共同実践ラボを通じて強力なリソースサポートを獲得しています。「第13次5カ年計画」建設の深化に伴い、伝統的なセキュリティ企業に加えて、ますます多くのインターネット企業も人工知能の進歩の波に加わり、人工知能は爆発的な成長を遂げました。

巨大なコンピューティングパワー、さまざまなオープンソースアーキテクチャ、研究者が提供する技術基盤、そして国の「第13次5カ年計画」などの有利な政策によってもたらされる強固な基盤サポートのおかげで、今日の時代において、セキュリティ業界は間違いなく人工知能にとって最高の「耕作地」です。この間に、数え切れないほどのアルゴリズム会社が誕生しました。思いつく限り、あらゆるインテリジェント分析のニーズに応えてくれる会社が必ず存在します。同様に、アルゴリズムの応用においては、顔認識アルゴリズムを利用して「顔スワイプ」ログイン、「顔スワイプ」ドア開閉、さらには感情や疲労の認識を実現する一連のアプリケーションが、セキュリティ業界全体で絶えず登場しています。ユーザーは喜んでお金を使い、メーカーは喜んで研究に投資します。今は人工知能にとって最高の時代です。

3. ジレンマ: 人工知能がセキュリティを再定義する

優れた AI = 計算能力 + アルゴリズム/サンプル。これが人工知能の従来の理解です。 AI 自体については、十分な正と負のサンプルと組み合わせた膨大な計算能力、さらに大量のトレーニングと調整されたアルゴリズムにより、基本的に満足のいく答えが得られます。人工知能構築の第一波では、誰もがより高い指標、より多くのラベル、より高いパフォーマンスを追求し、最終的な指標を達成するために多くの人的資源と物的資源を投入しました。プロジェクトが徐々に形になり始め、アルゴリズムが実際の戦闘に投入され、セキュリティ業界全体が正式に前進するにつれて、人々は回避できない問題を徐々に発見し始めています。それは、人工知能は単純なコンポーネント化された製品なのか、それとも体系的なソリューションなのかということです。この質問に答える前に、ディープラーニングのアルゴリズム自体を振り返ってみましょう。人工知能は、「知能」の度合いに基づいて、弱い人工知能、強い人工知能、スーパー人工知能に簡単に分類できます。

弱い人工知能とは、顔認識やAlphaGoなど、実際の思考能力を持たずに、特定の分野の仕事をインテリジェントな方法で効率的に完了する能力を指します。業界における人工知能への熱意が徐々に冷めていくにつれ、現在の人工知能は実はまだ弱い人工知能のレベルにあることにも誰もが気づき始めています。人工知能アルゴリズムは、要件を満たす画像に対しては高い精度を達成できますが、画像の品質が要件を満たさなくなると、指標は急激に低下します。セキュリティ業界における画像データは、写真であれビデオストリームであれ、基本的にフロントエンドカメラによって提供されるため、顔認識は従来のフロントエンドシステム全体にとって課題となります。

しかし、顔認識がうまく実装され、ユーザーに最適なソリューションを提供するには、これら以外にも多くの課題に直面します。人工知能を実装するには、エンドツーエンドシステムの各タイプのコンポーネントを再適応させる必要があります。人工知能はセキュリティを再定義し、各ノードの機器に新たな課題をもたらしました。前の質問に戻りますが、人工知能は単純なコンポーネント化された製品であるべきでしょうか、それとも体系的なソリューションであるべきでしょうか?答えは明らかです。セキュリティ業界では、製品を実装せずに製品について語ることは、単なる空論に過ぎません。人工知能アルゴリズムは、フロントエンド、ストレージ、ビッグデータ、アルゴリズムの計算能力のスケジューリング、さらにはプロトコル標準に対する厳格なサポート要件を備えたシステムソリューションです。コンピュータルーム、電気代、人件費、製品以外のその他のコストなど、セキュリティ業界の実装サポート要件は、間違いなく人工知能ソリューション全体の TCO に高い要件を課します。

4. カムバック: 実装と応用に焦点を当てる

今日では、人工知能は依然として業界で最もホットな話題です。しかし、ユーザーは、人工知能に初めて出会ったときほどアルゴリズムに対して懐疑的ではありません。多くの場合、ユーザーは、アルゴリズムの実現可能性を検証したり、アルゴリズムの製造元と協力して実験を行い、アルゴリズムが使用可能かどうかを判断することを好む傾向にあります。さまざまなメーカーやアルゴリズム企業も、プロジェクトの実践の中で、人工知能、ディープラーニング、ビッグデータだけに頼るだけでは不十分であることに気付きました。たとえば、Uniview は、アルゴリズムの実装と実用化に重点を置いた「シナリオ定義アルゴリズム」や「AI エンジニアリング」などのコンセプトを提案しています。同時に、新ラウンドのアルゴリズムの継続的な競争と「第13次5カ年計画」の建設パターンの入れ替えを通じて、実力と経験のあるメーカーは徐々に探求の方向を変え、アルゴリズムの実装、全体的なインテリジェント分析ソリューションの統合、ユーザーアプリケーションの完全なクローズドループとプロセスの簡素化に継続的に投資してきました。

人工知能アルゴリズムは最も核心的な技術であるため、継続的な投資と探求が必要です。これは永遠の真実です。一方、さまざまなアルゴリズムメーカーは、アルゴリズム指標を最も重要な競争上の優位性とは見なさなくなり、代わりにマルチアルゴリズムソリューションとアプリケーションエコシステムサポートを最も重要なハイライトと見なしています。これまで単一のアルゴリズムでは実現不可能だった業務も、異なるアルゴリズムを連携して検索・比較することで容易に実現可能となり、アプリケーションを統合した総合ソリューションが新たな建設のホットスポットとなっています。

5. 未来：終わりなき探究

今後、一方では、アルゴリズムとビジネスの高度な融合により、さまざまな業界で顕著な業界特性を持つ専用ビジネスとソリューションが必然的に形成され、顔認識の構築と開発の焦点は、さまざまな業界のビジネスシナリオに徐々に的を絞って調整されるでしょう。他方では、アルゴリズムの継続的な革新と均質化、およびGA / T1400標準（中華人民共和国の公共セキュリティ業界標準）の継続的な最適化により、アルゴリズムは標準化されたコンポーネントに向かって進化しています。当時のIPカメラと同様に、顔認識を含むさまざまなディープラーニングアルゴリズムが最終的に標準成果物となり、アルゴリズムを管理するためのマルチアルゴリズムサービスフレームワークプラットフォームが、次の波のプラットフォーム構築の新たなクライマックスとなることは間違いありません。

<<: AIは人間に取って代わるでしょうか？シリコンバレーの大物が人工知能の将来の発展の傾向を解説

>>: ガートナー：ディープフェイクと生成AIがゼロトラストの世界へ