オープンソース: ディープラーニングモデルと姿勢推定コードのオープンソースコードの推奨、人工知能チュートリアル

オープンソース: ディープラーニングモデルと姿勢推定コードのオープンソースコードの推奨、人工知能チュートリアル

オープンソース: ディープラーニング モデルとポーズ推定コードのオープンソース コードの推奨、人工知能チュートリアル (Fun AI によってコンパイル、ソースは modelzoo)。ポーズ推定のタスクは、RGB 画像またはビデオ内の人間のピクセルを人体の 3D 表面にマッピングすることを目的としています。ポーズ推定はマルチタスクタスクであり、オブジェクトの検出、ポーズ推定、セグメンテーションなど、いくつかの他の問題が関係します。姿勢推定のアプリケーションには、グラフィックス、拡張現実 (AR)、ヒューマン コンピュータ インタラクション (HCI) など、単純なランドマークの位置特定以上のものを必要とする問題が含まれます。姿勢推定には、3D ベースのオブジェクト認識の多くの側面も含まれます。この投稿では、姿勢推定のためのオープンソースのディープラーニング モデルとコードをいくつか紹介しました。共有する価値があると思われる実装を見逃していた場合は、下のコメント欄に残してください。

デンスポーズ

オープンソース: ディープラーニングモデルと姿勢推定コードのオープンソースコードの推奨、人工知能チュートリアル

GitHub | データセット

オープンソース: ディープラーニング モデルとポーズ推定コードのオープンソース コードの推奨、人工知能チュートリアル (Fun AI によってコンパイル、ソースは modelzoo)。この投稿は、先週初めに DensePose のコード、モデル、データセットをリリースした Facebook Research からインスピレーションを得たものです。 Facebook は、人間の姿勢を推定するための大規模なグラウンドトゥルースデータセットである DensePose-COCO を共有しました。このデータセットは、50,000 枚の COCO (Common Objects in Context) 画像に手動で注釈が付けられた画像と表面の対応関係で構成されています。これはディープラーニング研究者にとって非常に包括的なリソースです。ポーズ推定やパーツのセグメンテーションなどのタスクに適したデータソースを提供します。

DensePose の論文では、Mask-RCNN のバリエーションである DensePose-RCNN を提案し、人間の各領域内の部位固有の UV 座標を 1 秒あたり複数のフレームで密に回帰します。 DenseReg をベースにしています。モデルの目的は、各ピクセルの表面の位置と、それが属するパーツの対応する 2D パラメータを決定することです。

DensePose は、Feature Pyramid Network (FPN) 機能と ROI アライメント プーリングを備えた Mask-RCNN のアーキテクチャを採用しています。さらに、彼らは ROI プーリングに完全畳み込みネットワークを導入しました。より詳細な技術的詳細については、DensePose の論文を参照してください。

オープンポーズ

GitHub | データセット

オープンソース: ディープラーニング モデルとポーズ推定コードのオープンソース コードの推奨、人工知能チュートリアル (Fun AI によってコンパイル、ソースは modelzoo)。 OpenPose は、CMU 知覚コンピューティング ラボの身体、顔、手の評価のためのリアルタイムの複数人物キーポイント検出ライブラリです。 OpenPose は、2D および 3D の複数人物のキーポイント検出と、ドメイン固有のパラメータを推定するキャリブレーション ツールボックスを提供します。 OpenPose では、画像、ビデオ、Web カメラ、IP カメラなど、さまざまな入力が可能です。また、画像やキーポイント (PNG、JPG、AVI) などさまざまな形式で出力を生成し、キーポイントを読み取り可能な形式 (JSON、XML、YML) で保存したり、配列クラスとして保存したりすることもできます。入力および出力パラメータもさまざまなニーズに合わせて調整できます。

OpenPose は、CPU と GPU の両方で動作する C++ API を提供します (AMD グラフィック カードと互換性のあるバージョンも含む)。

リアルタイム複数人物姿勢推定

GitHub

オープンソース: ディープラーニング モデルとポーズ推定コードのオープンソース コードの推奨、人工知能チュートリアル (Fun AI によってコンパイル、ソースは modelzoo)。この実装は OpenPose と関連性が高く、さまざまなフレームワークで実装に関連したモデルが提供されています。この論文の著者らは、人物検出器を使用せずに複数人物の姿勢をリアルタイムで推定するボトムアップアプローチを提案しています。この方法では、部分類似性フィールド (PAF) と呼ばれる非パラメトリック表現を使用して、画像内の身体部位と個人を関連付けることを学習します。実装と理論に関する技術的な詳細については論文を参照してください。このアプローチの最も優れた点の 1 つは、すでにさまざまなフレームワークに実装されており、選択したフレームワークでコードとモデルをすぐに使用できることです。

  • OpenPose C++ ライブラリ
  • TensorFlow 実装
  • Keras 実装 1 と 2
  • PyTorchは1、2、3を実装している
  • MXNet 実装

アルファポーズ

[[234401]]

GitHub

オープンソース: ディープラーニング モデルとポーズ推定コードのオープンソース コードの推奨、人工知能チュートリアル (Fun AI によってコンパイル、ソースは modelzoo)。 Alpha Pose は、複数人の正確なポーズ推定ツールであり、初のオープンソース システムであると主張しています。 AlphaPose は、画像、ビデオ、または画像リストに対してポーズ推定とポーズ追跡を実行します。 PNG、JPEG、AVI 形式のキーポイント付き画像や、JSON 形式のキーポイント出力など、さまざまな出力を生成するため、アプリケーションに重点を置いたアプリケーションに最適なツールとなります。

現在、TensorFlow 実装と PyTorch 実装があります。 AlphaPose は、不正確な人間の境界ボックスが存在する場合でもポーズ推定を容易にするために、地域的な複数人物ポーズ推定 (RMPE) フレームワークを使用します。コンポーネントは 3 つあります: 対称空間トランスフォーマー ネットワーク (SSTN)、パラメトリック ポーズ非最大抑制 (NMS)、ポーズ ガイド付き提案ジェネレーター (PGPG)。より技術的な詳細については、論文を参照してください。

人間の姿勢推定

ウェブサイト | GitHub | データセット | ArtTrack 論文 | Darker 論文

オープンソース: ディープラーニング モデルとポーズ推定コードのオープンソース コードの推奨、人工知能チュートリアル (Fun AI によってコンパイル、ソースは modelzoo)。このリポジトリは、ArtTrack および DeeperCut の論文で紹介された人間の姿勢推定アルゴリズムの TensorFlow 実装を提供します。トレーニングされたモデルは、明示的な人間の姿勢の推定を評価するための豊富な画像コレクションである MPII 人間の姿勢データベースを活用します。このプロジェクトでは、現実世界の画像における複数の人物の姿勢推定を相関させるタスクを検討します。彼らのアプローチは、人物を検出してからその体の姿勢を推定する従来のアプローチとは異なり、検出と姿勢推定の両方のタスクに対処します。実装には CNN ベースのパーツ検出器と整数線形計画法が使用されます。より技術的な詳細については、ArtTrack および DeeperCut の論文を参照してください。

ディープポーズ

オープンソース: ディープラーニング モデルとポーズ推定コードのオープンソース コードの推奨、人工知能チュートリアル (Fun AI によってコンパイル、ソースは modelzoo)。 DeepPose は、2014 年に発表された比較的古い論文で、深層ニューラル ネットワーク (DNN) ベースの人間の姿勢推定法を提案しており、体の関節に対する DNN ベースの回帰問題として定式化されています。姿勢について総合的に考察し、シンプルでありながら強力な定式化を実現しています。 DeepPose の公式実装はオンラインでは入手できないようです。しかし、その結果を再現するための努力がなされてきました。

  • チェイナー実装
  • TensorFlow 実装

DeepPose は、人間の姿勢を推定する最初のディープラーニング アプリケーションであり、当初から最先端の結果を達成し、他の多くの新しい実装のベンチマークを提供している点で興味深いものです。

姿勢推定は、コンピューター ビジョン コミュニティでますます人気の高い問題です。 Facebook Research による DensePose-COCO などの新しいポーズ推定データセットのリリースにより、この分野での作業がさらに進むようになりました。私の意見では、姿勢推定を追求できる方向性は数多くあり、これらのリソースのリリースは間違いなくこの分野への新たな関心を喚起するでしょう。近いうちに多くの新しい革新的なアイデアや実装が見られることを期待しています。

<<:  AIスタートアップのRokidがKamino 18 AI音声チップをリリース、低電力ウェイクアップをサポート

>>:  速報 | SmartOneがAIショッピングガイドロボットを発表、マイクロソフトと戦略的提携を強化

ブログ    
ブログ    

推薦する

韓国はLK-99の室温超伝導は証明できないと信じており、国内チームは拡張された材料が魔法のような特性を持っていると信じている

韓国でセンセーショナルな「常温超伝導」事件が最近終息したようだ。韓国超伝導低温学会の検証委員会は最近...

...

...

複数の機会が生まれており、虹彩認識技術の将来の発展は有望である

[[424491]]近年、人工知能ブームの影響を受けて、生体認証技術は急速に進歩し、市場の発展も好調...

AIと機械学習をサイバーセキュリティに組み込む方法

仕事で使われるデバイスが多様化するにつれてサイバー攻撃も増えますが、AI はそれを防ぐのに役立ちます...

...

可用性の高い Java 分散システムの構築: システムの安定性と信頼性の確保

今日のインターネット アプリケーション開発では、可用性の高い分散システムを構築することが、システムの...

...

AIが初めて新型コロナウイルスの警告を発するのか?人工知能はあなたが思っている以上に信頼できるものです!

2019年12月30日に武漢で新型肺炎が発生してから1か月以上が経ちました。マスクの値上げや品切れ...

...

...

AI機能をエッジに拡張する方法: ストレージが基盤となる

[[270991]]人工知能技術の復活は、ここ数年の IT に代表される計算能力の大幅な向上が主な要...

顔認証決済の登場:「決済戦争」の次なる激戦点となるか?

[[280749]]最近、支払いをするために携帯電話を取り出すと、「顔支払い」を選択すると割引があ...

Meituanが小サンプル学習リストFewCLUEで1位にランクイン!迅速な学習 + 自己トレーニングの実践

著者: Luo Ying、Xu Jun、Xie Rui など1 概要CLUE(中国語言語理解評価) ...

...