錬金速度×7! MacでもPyTorchトレーニングでGPUアクセラレーションを利用できます

錬金速度×7! MacでもPyTorchトレーニングでGPUアクセラレーションを利用できます

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

これまでのところ、Pytorch は Mac での CPU トレーニングのみをサポートしています。

ちょうど今、Pytorch は最新バージョン v1.12 がGPU アクセラレーションをサポートできることを正式に発表しました。

M1シリーズチップを搭載したMacであれば大丈夫です。

つまり、Mac で「エリクサーを作る」には Pytorch を使う方が便利になります。

トレーニング速度は約7倍に向上します

この機能は、Pytorch と Apple の Metal エンジニアリング チームの協力により実現しました。

AppleのMetal Performance Shaders (MPS)を使用しています  PyTorch のバックエンドとして機能し、GPU アクセラレーション トレーニングを可能にします。

計算パフォーマンスを最適化するために、MPS は Metal GPU ファミリの固有の特性に合わせて各コアを微調整します。

Metal は OpenGL に似たフレームワークですが、OpenGL はさまざまなプラットフォームでのモバイル GPU レンダリングとコンピューティングに適しているのに対し、Metal は iOS/MacOS プラットフォーム専用ですが、パフォーマンスと使いやすさも考慮されています。

MPS は、Metal フレームワークに基づくライブラリであり、グラフィック処理、畳み込みニューラル ネットワークの構築、その他のタスクに GPU の高パフォーマンスを利用するために直接呼び出すことができます。

Appleは、M1 Ultra、20コアCPU、64コアGPU、128GB RAM、2TB SSDを搭載したMac Studioで公式にテストしました。

(このラインナップは、ほとんど贅沢な構成と言えます)。

彼らはそれぞれ、バッチサイズ 128 でResNet50 、バッチサイズ 64 でHuggingFace BERT 、バッチサイズ 64 でVGG16 をトレーニングしました。

下の図から、CPU アクセラレーションと比較して、GPU を使用するとモデルのトレーニング速度が約 7 倍、評価速度が最大約 20 倍向上することがわかります。

これを見て、一部のネットユーザーは、そのパフォーマンスがNvidia GPUを搭載したラップトップと比べてどうなのか疑問に思い始めました。

M1 の現在の純粋なコンピューティング性能は Nvidia 製品ほど優れていないものの、消費電力は依然として優れていると言う人もいます。今後、Apple がパフォーマンス面で徐々に追いつく可能性が非常に高いです。

全体的に、 Mac Studio は今のところかなり素晴らしいようです

彼はさらにこう説明した。

「結局のところ、これは128GB の GPU メモリを搭載し、4,800 ドルで購入できる最も安価なマシンです。GPU アクセラレーションの PyTorch サポートにより、大規模なモデルのトレーニングや大規模なバッチ サイズの構成に使用できます。」

私が行っているような DL 作業では、実際の計算能力よりもデータの読み込みがボトルネックになる可能性が高くなります。 ”

感動しましたか?

今すぐ試してみませんか?

macOS オペレーティング システムがバージョン 12.3 以上であり、arm64 ネイティブ Python がインストールされていることを確認してから、公式 Web サイトにアクセスして最新の Pytorch プレビュー バージョンをダウンロードしてください。

住所:
https://pytorch.org/blog/introducing-accelerated-pytorch-training-on-mac/

<<:  産業規模は500億に迫る。産業用ロボット業界は今後何をすべきか?

>>:  人工知能が金融市場をどう変えるのか

ブログ    
ブログ    

推薦する

人工知能が企業コミュニケーションに及ぼす10の影響

職場にソフトウェア ロボットや人工知能 (AI) が導入されると考えると、一部の労働者は不安を感じる...

AI 転移学習はどのように機能しますか? AI モデルとトレーニング プロセスでどのような役割を果たすのでしょうか?

今日、AI プログラムは、写真やビデオ内の顔や物体を認識し、音声をリアルタイムで書き起こし、X 線ス...

SVM のマップ削減データマイニングアルゴリズム

元のアルゴリズムに並列戦略を適用するのは難しいため、他のアルゴリズムのバリアントである pegaso...

人工知能のゲーム理論:エージェントと人間、エージェントと環境の間のゲーム関係の予備的調査

人工知能 (AI) は、コンピューターや機械をインテリジェントに動作させる方法を研究する分野です。機...

...

MLCommonsがAI安全ワーキンググループを発表

人工知能ベンチマーク組織 MLCommons は、人工知能安全性 (AIS) ワーキング グループの...

Google Loon の AI が開発者を驚かせる理由

北京時間3月5日、人工知能を使ったアルゴリズムが予想外のトリックで問題を解決しようとしており、開発者...

決まりました!国は人工知能に関する重要なニュースを発表し、これらの人々は集団的に失業することになるだろう...

1寝耳に水! 11月15日、国からビッグニュースが発表されました!科学技術部は、新世代人工知能開発...

PyTorch を軽量化します。このディープラーニング フレームワークは価値があります。 GitHub 6.6k スター

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ついに誰かがROSロボットオペレーティングシステムをわかりやすく説明しました

01 ROS入門多くの初心者は、ロボットのオペレーティングシステムと聞いて、「オペレーティングシス...

...

...

「より深く」「より鮮明に」見る - 超高精細画像におけるディープラーニングの応用

毎日肖像画を模写する練習を続けた結果、この芸術家はいくつかの重要な特徴だけを描いた人間の顔を完全に描...

...