TensorFlow と PyTorch: ディープラーニングに最適なフレームワークはどれですか?

この記事を読んでいるということは、おそらくすでにディープラーニングの旅を始めているということでしょう。この分野に詳しくない方のために説明すると、ディープラーニングは、特殊な脳のようなアーキテクチャである「人工ニューラルネットワーク」を使用して、現実世界の問題を解決できる人間のようなコンピューターを作成します。これらのアーキテクチャの開発を支援するために、Google、Facebook、Uber などのテクノロジー大手は、Python ディープラーニング環境用の複数のフレームワークをリリースし、さまざまな種類のニューラルネットワークの学習、構築、トレーニングを容易にしています。この記事では、2 つの一般的なフレームワークである TensorFlow と PyTorch を詳しく紹介し、比較します。

1. GoogleのTensorFlow

TensorFlow は、Google の開発者によって作成され、2015 年にリリースされたオープンソースのディープラーニングフレームワークです。公式の研究は論文「TensorFlow: 異機種分散システムにおける大規模機械学習」に掲載されました。

論文アドレス: http://download.tensorflow.org/paper/whitepaper2015.pdf

TensorFlow は現在、企業やスタートアップ企業でワークロードの自動化や新しいシステムの開発に広く利用されています。分散トレーニングのサポート、スケーラブルな生産および展開オプション、複数のデバイス (Android など) のサポートが高く評価されています。

2. FacebookのPyTorch

PyTorch は、Facebook のチームによって開発され、2017 年に GitHub でオープンソース化された最新のディープラーニングフレームワークの 1 つです。開発の詳細については、論文「PyTorch での自動微分化」を参照してください。

論文アドレス: https://openreview.net/pdf?id=BJJsrmfCZ

PyTorch は、そのシンプルさ、使いやすさ、動的な計算グラフのサポート、高いメモリ効率により、ますます人気が高まっています。これについては後で詳しく説明します。

TensorFlow と PyTorch を使って何を構築できるでしょうか?

ニューラルネットワークは最初、手書きの数字を認識したり、カメラを使用して車のナンバープレートを識別したりするなど、単純な分類問題を解決するために使用されました。しかし、最近のフレームワークの開発と NVIDIA の高性能グラフィックスプロセッシングユニット (GPU) の進歩により、テラバイト単位のデータでニューラルネットワークをトレーニングし、はるかに複雑な問題を解決できるようになりました。特筆すべき成果の 1 つは、TensorFlow と PyTorch に実装された畳み込みニューラルネットワークが、ImageNet で現在の最先端のパフォーマンスを達成したことです。トレーニングされたモデルは、オブジェクト検出、画像セマンティックセグメンテーションなどのさまざまなアプリケーションで使用できます。

ニューラルネットワークアーキテクチャは任意のフレームワークに基づいて実装できますが、結果は同じではありません。トレーニングプロセスには、フレームワークに密接に関連する多数のパラメーターがあります。たとえば、PyTorch でデータセットをトレーニングする場合、GPU は CUDA (C++ バックエンド) 上で実行されるため、GPU を使用してトレーニングプロセスを強化できます。 TensorFlow も GPU を使用できますが、独自の組み込み GPU アクセラレーションを使用します。したがって、モデルのトレーニングにかかる時間は、選択したフレームワークによって常に異なります。

1. TensorFlow 優秀プロジェクト

Magenta: 機械学習をクリエイティブプロセスのツールとして使用することを検討しているオープンソースの研究プロジェクト: https://magenta.tensorflow.org/

Sonnet: これは、複雑なニューラルネットワークを構築するために使用できる TensorFlow ベースのソフトウェアライブラリです: https://sonnet.dev/

Ludwig: これは、コードを書かずにディープラーニングモデルをトレーニングおよびテストするためのツールボックスです: https://uber.github.io/ludwig/

2. PyTorch の優れたプロジェクト

CheXNet: ディープラーニングを使用して胸部X線を分析し、放射線科医レベルの肺炎モニタリングを可能にする: https://stanfordmlgroup.github.io/projects/chexnet/

PYRO: これは、PyTorch バックエンドを備えた Python で書かれた汎用確率プログラミング言語 (PPL) です: https://pyro.ai (https://pyro.ai/)

Horizon: 応用強化学習 (Applied RL) のためのプラットフォーム: https://horizonrl.com (https://horizonrl.com/)

これらは、TensorFlow と PyTorch 上に構築されたフレームワークとプロジェクトのほんの一部です。詳細については、TensorFlow および PyTorch の GitHub および公式 Web サイトをご覧ください。

4. PyTorchとTensorFlowの比較

PyTorch と TensorFlow の主な違いは、コードの実行方法です。どちらのフレームワークも、基本データ型テンソルで動作します。テンソルは、次の図に示すように多次元配列として考えることができます。

1. メカニズム: 動的グラフ定義と静的グラフ定義

TensorFlow フレームワークは、次の 2 つのコアビルディングブロックで構成されています。

計算グラフと、それらのグラフをさまざまなハードウェア上で実行するためのランタイムを定義するソフトウェアライブラリ。
計算グラフには多くの利点があります (後ほど紹介します)。

計算グラフは、計算を有向グラフとして記述する抽象的な方法です。グラフは、ノード (頂点) とエッジで構成されるデータ構造であり、有向エッジによってペアで接続された頂点の集合です。

TensorFlow でコードを実行すると、計算グラフが静的に定義されます。外部とのすべての通信は、実行時に外部データに置き換えられるテンソルである tf.Sessionobject と tf.Placeholder を通じて実行されます。たとえば、次のコードスニペットを検討してください。

次の図は、TensorFlow でコードを実行する前に計算グラフが静的に生成される方法を示しています。計算グラフの主な利点は、並列化または依存関係駆動スケジューリングを実現できることです。これにより、トレーニングがより高速かつ効率的になります。

TensorFlow と同様に、PyTorch にも 2 つのコアモジュールがあります。

計算グラフのオンデマンドかつ動的な構築
Autograd: 動的グラフ上での自動微分の実行

下の図からわかるように、特別なセッションインターフェイスやプレースホルダーなしで、実行の進行に応じてグラフが変化し、ノードが実行されます。全体的に、このフレームワークは Python 言語とより緊密に統合されており、ほとんどの場合、よりネイティブな感じがします。つまり、PyTorch はより Python 的なフレームワークですが、TensorFlow はまったく新しい言語のように感じられます。

ソフトウェアの世界では、使用するフレームワークによって大きな違いがあります。 TensorFlow は TensorFlow Fold ライブラリを使用して動的グラフを実装する方法を提供しますが、PyTorch の動的グラフは組み込まれています。

2. 分散トレーニング

PyTorch と TensorFlow の主な違いの 1 つは、データの並列性です。 PyTorch がパフォーマンスを最適化する方法は、Python のネイティブの非同期実行サポートを活用することです。 TensorFlow では、分散トレーニングを実現するために、手動でコードを記述し、特定のデバイスで実行するように各操作を微調整する必要があります。ただし、PyTorch のすべての機能を TensorFlow で再現することは可能ですが、多くの作業が必要になります。次のコードスニペットは、PyTorch を使用してモデルの分散トレーニングを実装する簡単な例を示しています。

3. 視覚化

TensorFlow はトレーニングプロセスを視覚化する上で利点があります。視覚化により、開発者はトレーニングプロセスを追跡し、より便利なデバッグが可能になります。 TensorFlow の視覚化ライブラリは TensorBoard と呼ばれます。 PyTorch 開発者は Visdom を使用しますが、Visdom が提供する機能はシンプルで制限されているため、トレーニングプロセスを視覚化する場合には TensorBoard の方が適しています。

TensorBoard の機能:

損失や精度などの指標を追跡して視覚化する
計算グラフ（演算とレイヤー）を視覚化する
重み、バイアス、その他のテンソルのヒストグラムを時間経過とともに表示する
画像、テキスト、音声データを表示する
TensorFlow プログラムの分析

TensorBoardでのトレーニングの視覚化

Visdomの特徴:

コールバックの処理
図や詳細を描く
経営環境

Visdomでトレーニングを視覚化する

4. 本番環境への展開

トレーニング済みのモデルを本番環境にデプロイする場合、TensorFlow が明らかに勝者です。 REST クライアント API を使用するフレームワークである TensorFlow サービングを使用して、TensorFlow にモデルを直接デプロイできます。

PyTorch では、最新の 1.0 安定バージョンで本番環境へのデプロイが少し簡単になりますが、Web 上で直接モデルをデプロイするためのフレームワークは提供されていません。バックエンドサーバーとして Flask または Django を使用する必要があります。したがって、パフォーマンスを考慮する場合は、TensorFlow サービングの方が適している可能性があります。

5. PyTorchとTensorFlowを使用してシンプルなニューラルネットワークを定義する

PyTorch と TensorFlow でニューラルネットワークを宣言する方法を比較してみましょう。

PyTorch では、ニューラルネットワークはクラスであり、torch.nn パッケージを使用してアーキテクチャを構築するために必要なレイヤーをインポートできます。すべてのレイヤーは最初に __init__() メソッドで宣言され、次に forward() メソッドは入力 x がネットワークのすべてのレイヤーをどのように通過するかを定義します。最後に、変数モデルを宣言し、定義されたアーキテクチャに割り当てます ( model = NeuralNet() )。

最近、Keras は TensorFlow をバックエンドとして使用するニューラルネットワークフレームワークである TensorFlow ライブラリに統合されました。その時点から、TensorFlow でレイヤーを宣言するための構文は Keras の構文と似ています。まず、変数を宣言し、宣言するスキーマのタイプ (この場合は Sequential() スキーマ) に割り当てます。

次に、model.add() メソッドを使用して、レイヤーを順番に直接追加します。次のコードスニペットに示すように、レイヤータイプは tf.layers からインポートできます。

5. TensorFlow と PyTorch の長所と短所

TensorFlow と PyTorch にはそれぞれ長所と短所があります。

TensorFlow の利点:

シンプルな組み込みの高レベルAPI
TensorBoard によるトレーニングの視覚化
TensorFlow による簡単な本番環境への導入
簡単なモバイルプラットフォームのサポート
オープンソース
優れたドキュメントとコミュニティサポート

TensorFlow の欠点:

静止画像
デバッグ方法
すぐに変更するのが難しい

PyTorchの利点

Pythonのようなコード
ダイナミックなグラフィック
簡単かつ高速な編集
優れたドキュメントとコミュニティサポート
オープンソース
多くのプロジェクトでPyTorchが使用されています

PyTorch の欠点:

可視化には第三者が必要
本番環境の導入にはAPIサーバーが必要

6. PyTorchとTensorFlowのインストール、バージョン、アップデート

PyTorch と TensorFlow はどちらも最近、新しいバージョン、PyTorch 1.0 (最初の安定バージョン) と TensorFlow 2.0 (ベータバージョン) をリリースしました。どちらのバージョンにも、トレーニングプロセスをより効率的、スムーズ、強力にするためのメジャーアップデートと新機能が追加されています。

これらのフレームワークの最新バージョンをマシンにインストールする場合は、ソースからビルドするか、pip 経由でインストールできます。

1. PyTorchのインストール

macOS と Linux

 pip3 インストール torch torchvision

ウィンドウズ

pip3 インストール https://download.pytorch.org/whl/cu90/torch-1.1.0-cp36-cp36m-win_amd64.whl
 pip3 インストール https://download.pytorch.org/whl/cu90/torchvision-0.3.0-cp36-cp36m-win_amd64.whl

2. TensorFlowのインストール

macOS、Linux、Windows

 # CPUのみの現在の安定リリース
pip テンソルフローをインストール
# TensorFlow 2.0 ベータ版をインストール
pip でtensorflow ==2.0.0-beta1をインストールします

インストールが成功したかどうかを確認するには、コマンドプロンプトまたはターミナルを使用して次の手順に従います。

7. TensorFlow と PyTorch のどちらがおすすめか

TensorFlow は、強力な視覚化機能と高度なモデル開発のための複数のオプションを備えた、非常に強力で成熟したディープラーニングライブラリです。本番環境への導入オプションがあり、モバイルプラットフォームをサポートしています。一方、PyTorch フレームワークはまだ新しく、コミュニティの活動が活発で、Python と親和性があります。

AI 関連製品をより速く開発・構築したいのであれば、TensorFlow がよい選択肢であると私は提案します。 PyTorch は高速かつ動的なトレーニングをサポートしているため、研究開発者に推奨されます。

オリジナルリンク: https://builtin.com/data-science/pytorch-vs-tensorflow

[この記事は51CTOコラム「Machine Heart」、WeChatパブリックアカウント「Machine Heart（id:almosthuman2014）」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<: AI による顔を変える動画が何百万人ものユーザーを獲得。たった 1 ステップで楽しさから恐怖感まで

>>: 認知知能を業界の奥深くまで導くWAIC Baiduが言語と知識技術の完全なレイアウトを公開

TensorFlow と PyTorch: ディープラーニングに最適なフレームワークはどれですか?

新型コロナウイルスは「ターミネーター」か？人工知能で疫病と闘う

AIがテキストを元に「抽象画」を描いたらどうなるでしょうか？｜DeepMindの新アルゴリズム

言語モデルの氷山の一角: 微調整は不要、AI21 Labs は凍結モデルの未開発の可能性を探る

GPT-4はバードに追い抜かれても納得せず、最新モデルが市場に投入された

Google がオールラウンドな音楽転写 AI を発表: 曲を一度聴くだけでピアノとバイオリンの楽譜がすべて手に入る

ハッシュ長拡張攻撃に対して脆弱なアルゴリズム

PyTorch ジオメトリックライブラリとディープグラフライブラリを比較して、チームが最適な GNN ライブラリを選択できるようにします。

米国の都市、犯罪増加で顔認識技術の禁止を撤回

推薦する

人工知能ガバナンスには「人工知能」の有効活用が必要

同じプレフィックスとサフィックスを持つファイルを同じディレクトリに移動するためのアルゴリズム設計と C コードの実装

2021年に注目すべき5つのAIと機械学習のトレンド

人工知能を定義する10のキーワード

マスク氏が突然ツイッター買収を希望、上場廃止に2700億ドルで入札。ツイッターとテスラの株価は下落

AIはソフトウェアテスターの仕事を「奪う」のでしょうか?

CV の未来はこの 68 枚の写真にかかっているのでしょうか? Google BrainがImageNetを深く掘り下げる：トップモデルはすべて予測に失敗する

深層強化学習について知っておくべきこと