ディープラーニング プロジェクトに適した環境を構築するのは簡単な作業ではありません。処理すべきことはたくさんあります。ライブラリは特定のバージョンと一致する必要があり、環境全体を他のマシンに複製でき、すべてがマシン内のすべてのドライバーと通信できる必要があります。つまり、NVIDIA GPU 用の特定のドライバーをインストールする必要があり、CUDA ライブラリはドライバーおよび使用するフレームワークと互換性がある必要があります。
コンテナはソフトウェア開発の世界に革命をもたらしましたが、今ではデータ サイエンティストがより堅牢な環境を構築するのにも役立ちます。 一つ確かなことは、データ サイエンスはソフトウェア開発の世界から学ぶべきことがあるということです。 NVIDIA NGC は、AI を本番環境でトレーニングおよび展開するための GPU に最適化されたフレームワーク、事前トレーニング済みモデル、ツールキットを提供するソフトウェア ハブです。これは、モデルのトレーニングに必要なすべてのツールを備えたコンテナ レジストリです。caffee2、Pytorch、Tensorflow、Keras、Julia など、どのツールを使用するかは関係ありません。 NGC カタログには、生産に使用できるコンテナが多数用意されています。使用するコンテナを選択するだけです。 Nvidia NGC はコンテナ レジストリであるだけでなく、組織がモデルを本番環境に導入するのに役立つ多くの組み込み機能を備えています。 ゼロから始めるまず、GPU を搭載した Linux マシンから始めましょう (GPU は必須ではありませんが、モデルをトレーニングする場合は強くお勧めします)。この機能を Ubuntu 20.04 LTS と 18.04 LTS でテストしましたが、他の Linux ディストリビューションにも簡単に適応できます。 私たちは何をする必要がありますか?手順は簡単で、NVIDIA ドライバーと Docker をインストールするだけです。次に、必要な Docker イメージをダウンロードして作業を開始します。 ステップ1: Ubuntu 20.04にNVIDIAドライバーをインストールする 注意: 別の Ubuntu バージョンを使用している場合は、それに応じてスクリプトを変更してください。また、セキュア ブートが有効になっている場合、この方法は機能しません。
nvidia-smi コマンドを使用してインストールを確認します。次のような画面が表示されます。 ステップ2: Ubuntu 20.04にDockerをインストールする
注意: sudo 権限なしで docker コマンドを使用するには、ログアウトして再度ログインする必要があります。 ステップ3: DockerがNVIDIAドライバーと通信できるようにする
ここで、Docker が NVIDIA ドライバーと通信できるかどうかをテストします。これを行うには、次のコマンドを実行するだけで、手順 1 と同様の結果が表示されます。
注: さまざまなクラウド ホスティング プロバイダーを試しましたが、OS、VM タイプ、GPU によっては、この時点で再起動が必要になる場合があります。したがって、エラーが発生した場合は、sudo reboot を試して、上記のコマンドを再度実行してください。すべてが正常であれば、nvidia-smi の結果が表示されます。 ステップ 4: イメージを取得して実行してみましょう。
注: オペレーティング システムが Docker コンテナーに割り当てられたリソースを制限するのを回避するには、フラグ - shm-size=1g - ulimit memlock=-1 - ulimit stack=67108864 が必要です。 コンテナ内に入りましたので、すべてが動作しているかどうか確認してみましょう。 画像からわかるように、GPU は利用可能であり、TensorFlow はそれを使用できます。 最後に: docker環境にアクセスする マシンから切断すると、コンテナ内にいないことに気付くでしょう。 再度接続するには、docker ps を使用して実行中のコンテナの container_ id を見つけて、次の操作を行う必要があります。
最終まとめこのチュートリアルでは、NVIDIA NGC のイメージを使用して、すべてのライブラリとツールを備えた本番環境対応環境を簡単に作成できることを学びました。 NVIDIA ドライバーおよび必要なフレームワークと通信するように Docker を構成するのがいかに簡単かを確認しました。 これをすべて 5 分で完了しました。 |
<<: 手紙を開かずに読むことはできますか? MITのX線技術がネイチャー誌に掲載される
>>: 女性が30時間以上浴室に閉じ込められた。この危機的状況でAIは彼女を危険から救うことができるのか?
順序前回の記事「大規模 Web サイトのアルゴリズムとアーキテクチャに関する簡単な説明 (パート 1...
近年発表されたAIモデル、例えば言語、視覚、音声、生物学など各分野の大規模モデルは、Transfor...
[[330768]] 【51CTO.com クイック翻訳】世界中でデータの爆発的な増加がしばらく続...
1. ミュージックXRメーカーMusic XR Makerは、テンセントミュージック初のオーディオお...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
データ分析と人工知能は現在、世界のどの地域でも最も話題になっている技術です。特に昨年のジェネレーティ...
「どんな魔法が私たちを賢くするのでしょうか?魔法は魔法がないことです。知性の力は、単一の完璧な原理か...
高品質のデータ セットを使用して命令のチューニングを実行すると、大規模なモデルのパフォーマンスを迅速...
高度なサイバー攻撃が増加していることから、サイバーセキュリティは今日マイクロソフトにとって最優先事項...
近年、5Gが話題になっていますが、AIはまだ時代遅れになっていません。特に、インターネットが普及し、...