ZTEのインテリジェントビデオReIDアルゴリズムは大きな進歩を遂げ、3つの主要なデータセットで世界記録を更新しました。

ZTEのインテリジェントビデオReIDアルゴリズムは大きな進歩を遂げ、3つの主要なデータセットで世界記録を更新しました。

最近、ZTEコーポレーションは人物再識別(ReID)技術で画期的な進歩を遂げました。Market1501、DukeMTMC-reID、CUHK03という3つの主要なReIDデータセット(これら3つのデータセットは、業界で最も影響力のある大規模なラベル付きマルチターゲットマルチカメラ歩行者追跡データセットです)において、アルゴリズムの主要指標であるmAPとRank-1の精度は、これまでさまざまな科学研究機関や業界メーカーによって発表された結果と比較して大幅に向上し、業界1位となり、世界新記録を樹立しました。


2019年7月末にZTE ReIDテクノロジーが3つの公開データセットから取得した指標

歩行者再識別とは、視野角が重複しない複数のカメラ ネットワークで同じ歩行者を検索し、異なる場所と時間でカメラが捉えた歩行者ターゲットが同一人物であるかどうかを確認することを指します。つまり、コンピューター ビジョン アルゴリズムを使用して、カメラとシーン全体にわたる歩行者の認識と検索を解決します。この技術は、顔認識技術に続く機械学習による画像認識の大きな進歩です。歩行者の服装、体型、髪型、行動などの情報に基づいて歩行者を認識できるため、従来の手動によるビデオ確認に要する時間が短縮され、主要人物の軌跡を数十日から数分、数秒にまで特定できます。

人物再識別技術研究の分野では、ランク 1 精度と平均精度 (mAP) がアルゴリズムのレベルを測定するための中核的な指標です。 ZTEはこの技術に、マルチモジュール、マルチ粒度のジョイント特徴抽出ネットワークを革新的に提案し、カメラの撮影角度、色の違い、光の強さなどによって生じる横顔、遮蔽、顔の欠落などの複雑な状況を効果的に解決し、ネットワークの特徴マッチング性能を大幅に向上させました。3つの主要データセットにおけるRank-1(1位ヒット率)とmAP(平均精度)という2つの重要な指標で大幅な向上を達成し、1位を獲得して世界新記録を樹立しました。 (注:この結果は、タイミング情報を使用せず、再ランキングも行わずに取得されました)


ZTE ReID技術の部分的なテスト結果

ZTEは一貫して研究開発投資の拡大を主張してきました。5Gなどの通信事業に加え、ビデオやコンピュータービジョンの分野にも深く関わり、インテリジェントビデオ事業に注力しています。ターゲット検出、マルチターゲット追跡、さまざまなターゲット認識などの技術アルゴリズムに深い蓄積があり、革新的なブレークスルーを継続的に実現しています。早くも2017年には、マルチターゲット追跡(MOTチャレンジ)アルゴリズム評価で1位を獲得しました。実際の応用では、歩行者再識別技術を顔認識技術と組み合わせることで、既存の設備やインフラを最大限に活用し、カメラ間で取得した物体の継続的な追跡と軌跡の復元を実現し、データの時空間連続性を高め、人工知能の認知レベルを新たなレベルに引き上げることができます。

歩行者再識別技術が成熟するにつれて、大規模な人員のインテリジェント認識アプリケーションの継続的な開発が促進され、商業、交通、金融、公共安全などの分野に大きな応用価値と実用的意義をもたらし、人工知能がより多くのシナリオとより多くのユーザーにサービスを提供できるようになります。

<<:  GitHub Wanxing リソース: 強化学習アルゴリズムの実装、チュートリアル コード学習計画

>>:  Huaweiの「ブラックテクノロジー」がついに公開。サイバーバース以外にも重要なニュースがある

ブログ    
ブログ    
ブログ    

推薦する

グラフニューラルネットワークが深くなるほど、パフォーマンスは向上しますか?

数十または数百の層を持つニューラル ネットワークの応用は、ディープラーニングの重要な機能の 1 つで...

人工知能 (AI) は、研究室から実際のアプリケーションまでどのように異なるのでしょうか?

人工知能が実際の応用に入ると、遭遇する問題のほとんどは複雑になります。 しかし、現段階では、人工知能...

...

モデルのボトルネックを「ルート」から見つけよう!第一原理からディープラーニングを分析する

モデルのパフォーマンスを向上させたい場合、まず検索エンジンに問い合わせるのが本能でしょうか?通常、表...

...

...

アイウェア市場は1000億円規模を超えるか? 3Dプリントで「顔のカスタマイズ」を実現

私たちの日常生活には、近視用メガネ、サングラス、サングラス、遠視用メガネ、ゴーグルなど、視力矯正、視...

GPT-4 の補完精度はわずか 6% です。北京大学などが、初の「マルチラウンド、マルチモーダル」PPTタスク完了ベンチマークPPTCを提案

大規模言語モデル(ChatGPT や GPT-4 など)に関する最近の評価作業は、主に基本的な自然言...

AIをベッド管理に適用し、追跡予測により患者にベッドの空きを確保

[[228998]]画像出典: Visual China医療分野はAIが進歩していく上で重要な方向で...

チャットボットを作りたいですか?まず100通の遺書をすべて読む

[51CTO.com オリジナル記事]デリケートな状況にうまく対処するために、AI は絶望の言語につ...

ドローンと農業は互いに補完し合い、数千億ドルの価値がある広大なブルーオーシャンを共同で生み出す

かつて、農業と言えば、人々はいつも「真昼に畑を耕し、汗を地面に垂らす」という苦労を思い浮かべていまし...

人工知能がとても人気ですが、機械学習とディープラーニングの違いがわかりますか?

人工知能は最近大きな注目を集めています。人工知能を実装するための技術としてディープラーニングと機械学...

デジタルトランスフォーメーションとは、アルゴリズムがすべてを制御する仮想世界なのでしょうか?

5G建設の展開に伴い、「デジタルトランスフォーメーション」という言葉も注目を浴び、さまざまな展示会...

H100推理が8倍に急上昇! NVIDIAは10以上のモデルをサポートするオープンソースのTensorRT-LLMを正式に発表した。

GPU が不足している人々は、その苦境に別れを告げようとしています。 NVIDIA は現在、H10...