錬金速度×7！ MacでもPyTorchトレーニングでGPUアクセラレーションを利用できます

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

これまでのところ、Pytorch は Mac での CPU トレーニングのみをサポートしています。

ちょうど今、Pytorch は最新バージョン v1.12 がGPU アクセラレーションをサポートできることを正式に発表しました。

M1シリーズチップを搭載したMacであれば大丈夫です。

つまり、Mac で「エリクサーを作る」には Pytorch を使う方が便利になります。

トレーニング速度は約7倍に向上します

この機能は、Pytorch と Apple の Metal エンジニアリングチームの協力により実現しました。

AppleのMetal Performance Shaders （MPS）を使用しています PyTorch のバックエンドとして機能し、GPU アクセラレーショントレーニングを可能にします。

計算パフォーマンスを最適化するために、MPS は Metal GPU ファミリの固有の特性に合わせて各コアを微調整します。

Metal は OpenGL に似たフレームワークですが、OpenGL はさまざまなプラットフォームでのモバイル GPU レンダリングとコンピューティングに適しているのに対し、Metal は iOS/MacOS プラットフォーム専用ですが、パフォーマンスと使いやすさも考慮されています。
MPS は、Metal フレームワークに基づくライブラリであり、グラフィック処理、畳み込みニューラルネットワークの構築、その他のタスクに GPU の高パフォーマンスを利用するために直接呼び出すことができます。

Appleは、M1 Ultra、20コアCPU、64コアGPU、128GB RAM、2TB SSDを搭載したMac Studioで公式にテストしました。

（このラインナップは、ほとんど贅沢な構成と言えます）。

彼らはそれぞれ、バッチサイズ 128 でResNet50 、バッチサイズ 64 でHuggingFace BERT 、バッチサイズ 64 でVGG16 をトレーニングしました。

下の図から、CPU アクセラレーションと比較して、GPU を使用するとモデルのトレーニング速度が約 7 倍、評価速度が最大約 20 倍向上することがわかります。

これを見て、一部のネットユーザーは、そのパフォーマンスがNvidia GPUを搭載したラップトップと比べてどうなのか疑問に思い始めました。

M1 の現在の純粋なコンピューティング性能は Nvidia 製品ほど優れていないものの、消費電力は依然として優れていると言う人もいます。今後、Apple がパフォーマンス面で徐々に追いつく可能性が非常に高いです。

全体的に、 Mac Studio は今のところかなり素晴らしいようです。

彼はさらにこう説明した。

「結局のところ、これは128GB の GPU メモリを搭載し、4,800 ドルで購入できる最も安価なマシンです。GPU アクセラレーションの PyTorch サポートにより、大規模なモデルのトレーニングや大規模なバッチサイズの構成に使用できます。」

私が行っているような DL 作業では、実際の計算能力よりもデータの読み込みがボトルネックになる可能性が高くなります。 ”

感動しましたか？

今すぐ試してみませんか？