TorchCVは、北京大学の学生が開発したPyTorchベースのCVモデルフレームワークです。

機械学習によってもたらされたあらゆる破壊的技術の中でも、コンピュータービジョンの分野は業界関係者と学界の両方から最も注目を集めています。

公式バージョン 1.3 がリリースされたばかりの PyTorch は人気が高まっており、このディープラーニングフレームワークを中心に開発されるツールもますます増えています。最近、TorchCV と呼ばれるコンピュータービジョンモデルフレームワークが GitHub のトレンドリストに載っています。

プロジェクトリンク: https://github.com/donnyyou/torchcv

このライブラリは、ディープラーニングに基づくほとんどの CV 研究問題のソースコードを提供し、ユーザーが最も一般的に使用されている高度なコンピュータモデルを簡単に呼び出すことができるようにします。 TorchCV の作者 Donny You 氏は北京大学出身で、教育部の機械知覚・知能重点実験室の 3 年生です。

TorchCV でサポートされているモデル

TorchCV は、画像分類、セマンティックセグメンテーション、オブジェクト検出、ポーズ検出、インスタンスセグメンテーション、生成的敵対ネットワークなどのタスクで複数の一般的なモデルをサポートしています。リストは次のとおりです。

画像分類

VGG: 大規模画像認識のための非常に深い畳み込みネットワーク
ResNet: 画像認識のための深層残差学習
DenseNet: 密に接続された畳み込みネットワーク
ShuffleNet: モバイルデバイス向けの極めて効率的な畳み込みニューラルネットワーク
ShuffleNet V2: 効率的な CNN アーキテクチャ設計のための実践的なガイドライン
半順序プルーニング: ニューラルアーキテクチャ検索における最高の速度と精度のトレードオフ

セマンティックセグメンテーション

DeepLabV3: セマンティック画像セグメンテーションのための Atrous 畳み込みの再考
PSPNet: ピラミッドシーン解析ネットワーク
DenseASPP: ストリートシーンのセマンティックセグメンテーションのための DenseASPP
セマンティックセグメンテーションのための非対称非局所ニューラルネットワーク

物体検出

SSD: シングルショットマルチボックス検出器
より高速な R-CNN: 領域提案ネットワークによるリアルタイム物体検出に向けて
YOLOv3: 漸進的な改善
FPN: 物体検出のための特徴ピラミッドネットワーク

姿勢検出

CPM: 畳み込みポーズマシン
OpenPose: パーツ親和性フィールドを使用したリアルタイムの複数人物 2D ポーズ推定

インスタンスのセグメンテーション

マスクR-CNN

生成的敵対ネットワーク

Pix2pix: 条件付き敵対的ネットワークによる画像間の変換
CycleGAN: Cycle-Consistent を用いた非対画像間変換

TorchCV のクイックスタート

TorchCV は現在、Python 3.x と pytorch 1.0 のみをサポートしています。

 pip3 インストール -r requirements.txtcd 拡張機能
sh メイク.sh

TorchCVを使用して取得したモデルパフォーマンスデータ

以下に示すパフォーマンスデータは、論文の結果を完全に再現しています。

画像分類

セマンティックセグメンテーション

物体検出

姿勢推定

OpenPose: パーツ親和性フィールドを使用したリアルタイムの複数人物 2D ポーズ推定

インスタンスのセグメンテーション

マスクR-CNN

生成的敵対ネットワーク

ピクセツ
サイクルGAN

TorchCV データセット

TorchCV は、データセットサブディレクトリにあるすべてのタスクのデータ形式を定義します。以下は、セマンティックセグメンテーションのトレーニングに使用されるデータセットのディレクトリツリーの例です。 datasets/seg/preprocess フォルダー内のスクリプトを使用して、オープンソースデータセットを前処理できます。

フォルダアドレス: https://github.com/donnyyou/torchcv/tree/master/datasets/seg/preprocess

TorchCV コマンド

プロジェクト作成者は、ユーザーがモデルを使用するためのコマンドラインツールを提供しています。コードは次のとおりです。

電車

cd スクリプト/seg/cityscapes/
 bash run_fs_pspnet_cityscapes_seg.sh トレインタグ

トレーニングを再開する

cd スクリプト/seg/cityscapes/
 bash run_fs_pspnet_cityscapes_seg.sh トレインタグ

確認する

cd スクリプト/seg/cityscapes/
 bash run_fs_pspnet_cityscapes_seg.sh val タグ

テスト

cd スクリプト/seg/cityscapes/
 bash run_fs_pspnet_cityscapes_seg.sh テストタグ

2019年、PyTorchは徐々にTensorFlowを追い越し、研究分野で最も人気のあるディープラーニングフレームワークになりつつあります。後者を使用する人が増えるにつれて、将来的にはより効率的なツールが登場するでしょう。

<<: スマートコミュニティにおける人工知能応用の5つのシナリオ

>>: 現代の分散ストレージシステムをサポートするアルゴリズム

ブログ

TorchCVは、北京大学の学生が開発したPyTorchベースのCVモデルフレームワークです。

AIと人間: 人工知能は常に進歩し、人間は常に進化している

調査によると、AIはデータ文化に大きな影響を与えている

百度のAIが海淀区の「スマートスクリーン」を実現、1秒で全状況を把握

RELX: 回答者の95%がAI人材の採用は課題であると考えている

こんにちは。タクシーに乗って空へ行きたいです。右へ飛んでください。

AIをホームセキュリティに活用する方法

ショック！ Google がショウジョウバエの脳全体を自動で再構築: 40 兆ピクセルの画像が初めて公開されました。

製造業における機械学習と人工知能

推薦する

Java プログラミングスキル - データ構造とアルゴリズム「基数ソート」

生産効率の向上以外に、AI テクノロジーは製造業に何をもたらすのでしょうか?

人間と自律的に討論できる最強のAI討論機が登場。その脳内には4億件のニュース記事が保存されている。

DeepMind が 3 つの新しいフレームワークを同時にオープンソース化しました。深層強化学習の応用は春の到来を告げるのでしょうか?

人工知能はテストで人間のパイロットを「圧倒」します。人間のパイロットはどうすれば人工知能に勝つことができるのでしょうか?

Ascend College Suzhou Technology オープンデーが間もなく開催されます。技術的な知識と実践的な経験が得られます。

ChatGPT の機能低下が論争を引き起こしています。AIGC アプリケーションは依然として信頼できるのでしょうか?

任正非氏と世界の人工知能専門家との対話の全文記録：ファーウェイの5G技術は米国にのみ販売されている

サーバーレスコンピューティングによる機械学習の解決策は何でしょうか?

一般的な負荷分散アルゴリズムをいくつ知っていますか?