PyTorch を軽量化します。このディープラーニングフレームワークは価値があります。 GitHub 6.6k スター

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

PyTorch は、そのシンプルさと使いやすさから、 AI 研究者の間で常に人気があります。

ただし、タスクが複雑になると、一連のエラーが発生する可能性があり、時間がかかります。

こうして、このような「フレンドリーな」PyTorch Lightning が誕生しました。

GitHub で直接 6.6k 個のスターを獲得しました。

まず、研究コードとエンジニアリングコードを分離し、PyTorch コードを構造化して、データ操作プロセスをより直感的に表示します。

こうすることで、理解しやすくなり、エラーも起こりにくくなります。元々長かったコードが突然軽量になり、AI 研究者にとって非常に使いやすくなります。

では早速、「PyTorch」の軽量バージョンを見てみましょう。

ライトニングについて

Lightning は、DL/ML コードを研究コード、エンジニアリングコード、非必須コードの 3 つのタイプに分類します。

Lightning では、コードごとに異なる処理方法があります。

ここでの研究コードは、GAN、VAE などの特定のシステムとそのトレーニング方法を参照します。このタイプのコードは、LightningModule によって直接抽象化されます。

MNIST 生成を例に挙げてみましょう。

 l1 = nn.Linear(...)
 l2 = nn.Linear(...)
デコーダー = デコーダー()
 x1 = l1(x)
 x2 = l2(x2)
出力 = デコーダー(特徴, x)
損失 = perceptual_loss(x1, x2, x) + CE(出力, x)

エンジニアリングコードとは、早期停止、GPU による割り当て、16 ビット精度など、このシステムのトレーニングに関連するすべてのコードです。

これらのコードはほとんどのプロジェクトで同じであることがわかっているので、ここでは Trainer によって直接抽象化されます。

モデル.cuda( 0 )
 x = x.cuda( 0 )
分散 = 分散並列(モデル)
 gpu_zeroの場合:
ダウンロードデータ()
 dist.barrier()

残りは、研究プロジェクトには役立つものの、研究プロジェクトとは関係のない、おそらく勾配をチェックしたり、テンソルボードにログを記録したりする、必須ではないコードです。このコードはコールバックによって抽象化されます。

 # ログサンプル
z = Q.rsample()
生成された = デコーダー(z)
 self.experiment.log( 'images' , 生成)

さらに、PyTorch コードを 1 行も変更せずに CPU、GPU、複数の GPU、または TPU でモデルをトレーニングできる、16 ビットの精度でトレーニングできる、Tensorboard を使用して 5 つの方法で記録できるなどの追加機能もあります。

これは明らかではないかもしれないので、PyTorch と PyTorch Lightning の違いを直感的に比較してみましょう。

PyTorch と PyTorch Lightning の比較

写真を見てください。

モデル、データ、損失関数、最適化という 4 つの主要部分から始めて、単純な MNIST 分類器を構築する例を見てみましょう。

モデル

最初のステップはモデルを構築することです。今回は、28×28 の画像を入力として受け取り、0～9 の数字の 10 カテゴリの確率分布に変換する 3 層の全接続ニューラルネットワークを設計します。

コードは両方ともまったく同じです。つまり、PyTorchモデルをPyTorch Lightningに変換するには、nn.Moduleをpl.LightningModuleに置き換えるだけでよいのです。

おそらくこの時点では、まだ Lightning の魔法は見えていないでしょう。心配しないで、見続けましょう。

データ

次はデータ準備の部分です。Lightning がこの処理を実行する点を除けば、コードはまったく同じです。

PyTorchコードを4つの関数、prepare_data、train_dataloader、val_dataloader、test_dataloaderに整理します。

準備データ

この機能により、複数の GPU を使用するときに、複数のデータセットをダウンロードしたり、データに対して複数の操作を実行したりすることがなくなります。この方法により、すべてのコードで、重要なセクションが 1 つの GPU からのみ呼び出されることが保証されます。

これにより、PyTorch が常にデータを繰り返し処理するという問題が解決され、速度が向上します。

トレーニングデータローダー、val_dataloader、テストデータローダー

それぞれが対応するデータセグメンテーションを返す役割を担っているため、データがどのように操作されるかを明確に把握できます。これまでのチュートリアルでは、データがどのように操作されるかはほとんどわかりませんでした。

さらに、Lightning では、テストや検証に複数のデータローダーを使用できます。

最適化

次は最適化です。

違いは、Lightning が Configuration Optimizer の機能に編成されていることです。複数のオプティマイザーを使用する場合は、両方を返すことができます。

損失関数

n 項目の分類では、クロスエントロピー損失を計算します。両方のコードはまったく同じです。

さらに、より直感的な検証とトレーニングのループもあります。

PyTorch では、for ループを自分で構築する必要があることはわかっています。単純なプロジェクトでは問題ないかもしれませんが、より複雑で高度なプロジェクトに遭遇すると、失敗しやすくなります。

Lightning の抽象コードは、Lightning の強力なトレーナーチームによって管理されます。

PyTorch Lightning インストールチュートリアル

これを読んで、あなたもインストールして試してみませんか？

PyTorch Lightning はインストールが非常に簡単です。

コードは次のとおりです。

 conda をアクティブ化 my_env
 pip pytorch-lightning をインストールします

または、conda 環境がなくても pip を使用できます。

コードは次のとおりです。

 pip pytorch-lightning をインストールします

作者も大物

PyTorch Lightning の作者である William Falcon 氏は、現在ニューヨーク大学で人工知能の博士号を取得しており、Forbes の AI に関する寄稿ライターでもあります。

2018 年にコロンビア大学を卒業し、コンピューターサイエンスと統計学の学位を取得しました。学部在学中は数学も副専攻していました。

彼は現在、博士号取得のためにGoogle Deepmindから奨学金を受け取っており、昨年はFacebook AI Researchからインターンシップの招待も受けています。

さらに、彼は海軍士官であり、アメリカ海軍特殊部隊SEALsから訓練を受けていました。

少し前にウォールストリートジャーナルが、呼吸器疾患と呼吸パターンの関係を研究しているこのチームについて言及しました。考えられる応用シナリオとしては、電話で COVID-19 の症状を診断することが挙げられます。現在、チームはまだデータ収集段階にあります。

確かに、優秀な人は何をするにも優秀です。はぁ……

どうですか、試してみませんか？下のリンクをクリックしてダウンロードしてご覧ください!

ポータルを使い始める

https://github.com/PyTorchLightning/pytorch-lightning

pytorch-lightning.readthedocs.io/en/latest/index.html を参照してください。

<<: ファーウェイアセンドアカデミーテクノロジーオープンデーが成都で開催され、開発者とともにAIの新時代を創造

>>: 中国がAI技術をリードしているのは数学が優れているからでしょうか？米誌、中国と米国の数学教育の格差を指摘

ワイツマンとNVIDIAは、自然言語を使って写真を編集できるText2LIVEを共同でリリースした。

PyTorch を軽量化します。このディープラーニングフレームワークは価値があります。 GitHub 6.6k スター

ライトニングについて

PyTorch と PyTorch Lightning の比較

モデル

データ

最適化

損失関数

PyTorch Lightning インストールチュートリアル

作者も大物

ポータルを使い始める

ワイツマンとNVIDIAは、自然言語を使って写真を編集できるText2LIVEを共同でリリースした。

ChatGPT の大きなアップデート！ OpenAI はプログラマー向けの素晴らしいギフトパッケージを提供しています。API にキラー機能が追加され、値下げ、新しいモデル、4 つのコンテキストがすべて揃っています。

自動運転テストシステムを1つの記事で理解する

JavaScript による機械学習の例 10 選

私の国のドローンは新たな段階に入り、成熟した開発にはまだ3つのレベルを通過する必要があります

Facebookのスマートスピーカー「フィオナ」と「アロハ」が今月下旬に発売される

2020年が到来。人工知能について知っておくべきこと

研究者たちは建設における人工知能の利用を研究している

一人称視点でガンダムを運転する？！コックピットに直接座り、VRを操作して材料を掴む。掘削機よりも柔軟。

推薦する

ディープラーニングチップ研究の新潮流：処理の中核となるメモリ

新しいマイクロ液体ロボット:「食べ物」がある限り、連続的かつ自律的に動作可能

清華大学の博士が「チップレット・アクチュアリー」サミットを提案！ムーアの法則に近づくほど、マルチチップ統合のコスト効率は向上する。

Terence Tao さんがリポストして「いいね！」しました！ ChatGPTは自動的に大きな進歩を証明し、AIは10年後に数学の世界を支配するだろう

スマートテクノロジーが現代のビジネス運営を改善する7つの方法

ChatGPTへの対処方法

人工知能のこれら 5 つのトレンドは世界にどのような影響を与えるでしょうか?

一流の科学者はどうやって AI を習得するのでしょうか? DeepSpeed4Science: 高度な AI システム最適化技術を使用して科学的発見を可能にする

ロボティックプロセスオートメーション (RPA): 6 つのオープンソースツール

Nvidia、AIを使った仮想世界のリアルタイムレンダリングを実演

AI Factory がコンセプトから産業化まで迅速かつ安全に移行する方法