TorchCVは、北京大学の学生が開発したPyTorchベースのCVモデルフレームワークです。

TorchCVは、北京大学の学生が開発したPyTorchベースのCVモデルフレームワークです。

機械学習によってもたらされたあらゆる破壊的技術の中でも、コンピュータービジョンの分野は業界関係者と学界の両方から最も注目を集めています。

公式バージョン 1.3 がリリースされたばかりの PyTorch は人気が高まっており、このディープラーニング フレームワークを中心に開発されるツールもますます増えています。最近、TorchCV と呼ばれるコンピューター ビジョン モデル フレームワークが GitHub のトレンド リストに載っています。

プロジェクトリンク: https://github.com/donnyyou/torchcv

このライブラリは、ディープラーニングに基づくほとんどの CV 研究問題のソース コードを提供し、ユーザーが最も一般的に使用されている高度なコンピュータ モデルを簡単に呼び出すことができるようにします。 TorchCV の作者 Donny You 氏は北京大学出身で、教育部の機械知覚・知能重点実験室の 3 年生です。

TorchCV でサポートされているモデル

TorchCV は、画像分類、セマンティック セグメンテーション、オブジェクト検出、ポーズ検出、インスタンス セグメンテーション、生成的敵対ネットワークなどのタスクで複数の一般的なモデルをサポートしています。リストは次のとおりです。

画像分類

  • VGG: 大規模画像認識のための非常に深い畳み込みネットワーク
  • ResNet: 画像認識のための深層残差学習
  • DenseNet: 密に接続された畳み込みネットワーク
  • ShuffleNet: モバイルデバイス向けの極めて効率的な畳み込みニューラル ネットワーク
  • ShuffleNet V2: 効率的な CNN アーキテクチャ設計のための実践的なガイドライン
  • 半順序プルーニング: ニューラル アーキテクチャ検索における最高の速度と精度のトレードオフ

セマンティックセグメンテーション

  • DeepLabV3: セマンティック画像セグメンテーションのための Atrous 畳み込みの再考
  • PSPNet: ピラミッドシーン解析ネットワーク
  • DenseASPP: ストリートシーンのセマンティックセグメンテーションのための DenseASPP
  • セマンティックセグメンテーションのための非対称非局所ニューラルネットワーク

物体検出

  • SSD: シングルショットマルチボックス検出器
  • より高速な R-CNN: 領域提案ネットワークによるリアルタイム物体検出に向けて
  • YOLOv3: 漸進的な改善
  • FPN: 物体検出のための特徴ピラミッドネットワーク

姿勢検出

  • CPM: 畳み込みポーズマシン
  • OpenPose: パーツ親和性フィールドを使用したリアルタイムの複数人物 2D ポーズ推定

インスタンスのセグメンテーション

マスクR-CNN

生成的敵対ネットワーク

  • Pix2pix: 条件付き敵対的ネットワークによる画像間の変換
  • CycleGAN: Cycle-Consistent を用いた非対画像間変換

TorchCV のクイック スタート

TorchCV は現在、Python 3.x と pytorch 1.0 のみをサポートしています。

  1. pip3 インストール -r requirements.txtcd 拡張機能
  2. sh メイク.sh

TorchCVを使用して取得したモデルパフォーマンスデータ

以下に示すパフォーマンス データは、論文の結果を完全に再現しています。

画像分類

セマンティックセグメンテーション

物体検出

姿勢推定

  • OpenPose: パーツ親和性フィールドを使用したリアルタイムの複数人物 2D ポーズ推定

インスタンスのセグメンテーション

  • マスクR-CNN

生成的敵対ネットワーク

  • ピクセツ
  • サイクルGAN

TorchCV データセット

TorchCV は、データセット サブディレクトリにあるすべてのタスクのデータ形式を定義します。以下は、セマンティックセグメンテーションのトレーニングに使用されるデータセットのディレクトリツリーの例です。 datasets/seg/preprocess フォルダー内のスクリプトを使用して、オープンソース データセットを前処理できます。

フォルダアドレス: https://github.com/donnyyou/torchcv/tree/master/datasets/seg/preprocess

TorchCV コマンド

プロジェクト作成者は、ユーザーがモデルを使用するためのコマンドライン ツールを提供しています。コードは次のとおりです。

電車

  1. cd スクリプト/seg/cityscapes/
  2. bash run_fs_pspnet_cityscapes_seg.sh トレインタグ

トレーニングを再開する

  1. cd スクリプト/seg/cityscapes/
  2. bash run_fs_pspnet_cityscapes_seg.sh トレインタグ

確認する

  1. cd スクリプト/seg/cityscapes/
  2. bash run_fs_pspnet_cityscapes_seg.sh val タグ

テスト

  1. cd スクリプト/seg/cityscapes/
  2. bash run_fs_pspnet_cityscapes_seg.sh テストタグ

2019年、PyTorchは徐々にTensorFlowを追い越し、研究分野で最も人気のあるディープラーニングフレームワークになりつつあります。後者を使用する人が増えるにつれて、将来的にはより効率的なツールが登場するでしょう。

<<:  スマートコミュニティにおける人工知能応用の5つのシナリオ

>>:  現代の分散ストレージシステムをサポートするアルゴリズム

ブログ    
ブログ    

推薦する

政府データ保護におけるAIの役割

1. 背景米国政府機関は機密データを保護し、潜在的な脅威に対応する任務を負っています。現在、リモート...

人工知能 vs 人間の知能: 人間と機械の融合が未来か?

[[187064]]人工知能を研究するアメリカの企業カーネルの投資家ブライアン・ジョンソン氏は、埋...

...

シングルを保存: このオブジェクトジェネレーターは、将来のオブジェクトがどのように見えるかを確認するのに役立ちます

将来の妻や夫がどんな人か分からないですか?さあ、まずはAIを使って予測してみましょう。 [[3123...

OpenAIは、レビューの効率を向上させ、人間の関与を減らすことができるコンテンツレビュー機能をテストしている。

人工知能のスタートアップ企業OpenAIは8月16日、GPT-4がコンテンツレビュー機能をテストして...

8x7B オープンソース MoE が Llama 2 に勝ち、GPT-4 に迫る!欧州版OpenAIがAI界に衝撃を与え、22人の企業が半年で20億ドルの評価額を獲得

オープンソースの奇跡が再び起こりました。Mistral AI が初のオープンソース MoE 大規模モ...

機械学習があなたの好きな音楽を発見する方法: パーソナライズされた音楽推奨の背後にある科学

今週の月曜日も、他の月曜日と同様に、Spotify の 1 億人を超えるユーザー全員に新しいプレイリ...

単語ベクトル計算とテキスト分類ツール fastText の応用原理と実践

FastTextは、Facebookが2016年にオープンソース化した単語ベクトル計算およびテキスト...

中間レビュー: 2021 年に最も注目される AI スタートアップ 10 社

[[407377]] 2021年はまだ半分しか経っていませんが、人工知能に注力する人気のスタートアッ...

プライベート5GとAI技術は自動化から自律性への移行を加速させる

モノのインターネットとインダストリー 4.0 の登場以来、マシン ビジョン、人工知能、機械学習、ディ...

全天候型インテリジェント無人配達、即時消費が「無人」時代の到来を告げる

「携帯電話で注文すれば、1時間以内に商品が自宅に届く」という即時消費が「無人」時代の到来を告げた。本...

青いテスラ モデルXが米国で中央分離帯に衝突し炎上

最近、自動車業界は混乱しています。 !ウーバーの自動運転車の致命的な事故に続いて、金曜の朝、米国のハ...

マイクロソフトリサーチアジア、ウェイ・フル氏:人工知能における基礎イノベーションの第2次成長曲線

人工知能の発展の観点から見ると、GPT シリーズのモデル (ChatGPT や GPT-4 など) ...

...