100倍速い!ディープラーニングトレーニングツールであるDetermined AIがオープンソースになりました。より速く、よりシンプルに、より強力に

100倍速い!ディープラーニングトレーニングツールであるDetermined AIがオープンソースになりました。より速く、よりシンプルに、より強力に

ディープラーニングの研究者として、私はモデルのトレーニングに深く悩まされています。モデルを何日も何晩も実行し、最終的に1つのステップが間違っていることに気づき、最初からやり直す必要があるのです。

ハイパーパラメータをいくら調整しても、精度が高くない。本当に疲れた…

システム環境を手動で調整します。間違えると動作しなくなります...

多くの場合、モデルをトレーニングするだけでも、膨大な時間と多くの変更、そして長い待ち時間が必要になります。本当に心の中で泣きます!

すると、まだ救われる可能性があることがわかりました。決意を固めた AI がカラフルな雲に乗って私を救出に来たのです!

この問題に悩まされていた多くのディープラーニング研究者は、数年を費やし、ついに膨大な数のディープラーニング実践者にとって便利なトレーニングツールを開発しました。

このディープラーニング トレーニング プラットフォームは、この分野に長年携わってきた専門家によって 3 年かけて構築されました。彼らの目標は、ディープラーニング チームがモデルをより速くトレーニングし、GPU リソースを簡単に共有し、効果的に共同作業できるようにすることです。

Definitely を使用すると、ディープラーニング エンジニアは、DevOps を気にしたり、フォールト トレランスや実験の追跡などの一般的なタスクのコードを記述したりすることなく、大規模なモデルの構築とトレーニングに集中できます。

公式ウェブサイトリンク:

https://determined.ai/developers/

「ちょっと待ってください、ここには何が入っているのですか?詳しく説明してもらえますか?」

わかりました。では、詳しく見て、全部お見せします。

モデルのトレーニングに集中して、より速く、より正確に!

ご存知のとおり、完全なディープラーニング プロジェクトには、データの準備、モデルのトレーニング、モデルの展開が含まれます。

Definitely を使用すると、サンプル コードや DevOps に多くの時間と労力を費やすのではなく、モデル自体のトレーニングに集中できるようになります。

モデルのトレーニング部分では、Determined は次の作業を完了するのに役立ちます。

  • より高速な分散トレーニング
  • インテリジェントなハイパーパラメータ最適化
  • 実験の追跡と視覚化

こうすることで、モデルのトレーニングという目の前のタスクに集中できるようになります。

トレーナーは、ディープラーニング作業用に作成された専用環境にすぐにアクセスし、インストール、ティアダウン、その他の定型コードについて心配することなく、モデルのセットアップに時間を費やすことができます。

これを見ると、開発者は本当に思慮深いと言いたいです。彼らは私たちが何に時間をかけたくないかを正確に知っています。本当に感謝しています*100!

それで、このアーティファクトは私たちに何の役に立つのでしょうか?

  • 実験の追跡、効率的なデータの読み込み、フォールト トレランス、柔軟なカスタマイズをサポートする組み込みのトレーニング ループ抽象化。
  • コードを変更することなく、高性能な分散トレーニングを実現します。
  • 最先端の研究に基づいた自動ハイパーパラメータ最適化。

これらの機能により、モデルのトレーニングが非常に簡単になります。上司はもう私のモデルについて心配する必要はありません!

公式ウェブサイトのリンクをクリックするだけで、以下の機能を体験できます。

次に、モデル トレーニングに密接に関連する 2 つの部分、つまり分散トレーニング速度とインテリジェントなハイパーパラメータ最適化について見てみましょう。

分散トレーニング

Definitely は主に Horovod を使用しています。Horovod を出発点として、研究者は長年の専門知識と経験を活かして、トレーニング プロセス全体をインベントリ構成よりもはるかに高速化しました。

このようにして、無駄な時間を削減し、コンピューターのハードウェアをより有効に活用して、効率的なトレーニング速度を実現できます。

Horovod に関する基本情報は次のとおりです。

Horovod は TensorFlow 用の分散トレーニング フレームワークで、Uber によって構築され、オープンソース化されており、現在は Uber の Michelangelo 機械学習サービス プラットフォーム上で実行されています。 Horovod は、分散型ディープラーニング プロジェクトの立ち上げと実行を簡素化し、加速します。大量のデータや大規模なモデルがある場合、機械学習モデルのトレーニングの効率を向上させるために、一般的にマルチ GPU 分散トレーニングが使用されます。 TensorFlow クラスターには、概念が多すぎる、学習曲線が急峻である、修正コードが大量である、パフォーマンスの損失が大きいなど、多くの欠点があります。Horovod はディープラーニングをさらに向上させます。規模が大きくなるにつれて、Horovod のパフォーマンスは基本的に直線的に増加し、損失は TensorFlow よりもはるかに小さくなります。

Horovod の詳細については、以下のリンクをクリックして学習して理解してください。

「TensorFlow クラスターを諦めて Horovod を採用する時が来た」

https://www.infoq.cn/article/J4ry_9bsfbcNkv6dfuqC

分散モデルは、Determined を使用してどのくらいの速さでトレーニングできますか?下の写真を見ると、24 倍に達することがわかります。 !

PS: 本当にずっと速くなった気がします...

[[324693]]

ハイパーパラメータの最適化

タスクと緊密に統合された最先端のインテリジェント検索機能とデフォルトの並列設定を提供することで、開発者は従来のハイパーパラメータ検索デバッグの煩わしさを回避するのに役立ちました。

このようにして、より高速に、より正確なモデルを取得できます。

Definitely を使用すると、ハイパーパラメータの最適化の速度はどのくらい向上しますか?

100回!これを見て、本当に感動しました...余った時間でどうぶつの森をプレイできますか?とにかく、ACAL2020の準備という正当な理由がありますハハハ〜

GPUスケジューリングはより柔軟になり、さまざまな一般的なフレームワークをサポートします。

また、Determined は、次のような GPU スケジューリングをより柔軟に実行することもできます。

1) トレーニングタスクのサイズを動的に調整する

2) AWSとGCP上のクラウドリソースを自動管理

同時に、TensorBoard や GPU ベースの Jupyter Notebook もサポートできます。 (私の親しい友人もこのプラットフォームで使用できます!!)

「TensorflowとPytorchの両方をサポートできますか?」 - 通行人Aは思わず

ああ、もう 1 つ重要な点があります。このプラットフォームを使用しながら、Tensorflow と Pytorch を引き続き使用できるということです。Determined API を実装するには、モデル コードを変更するだけです。

便利ですよね!

プラットフォームは透明性とオープン性を備え、ユーザーサービスも充実しています。

ディープラーニングチームコラボレーションツール

このプラットフォームは透明性があり、オープンで、チームコラボレーションに便利なので、ディープラーニング チームに最適です。

Definitely は、実験の追跡、ログ管理、メトリクスの視覚化、再現性、依存関係の管理などを通じて、誰もが実験管理を成功させるのに役立ちます。このプラットフォームはあらゆる規模のチームに最適です。

チームで開始し、準備ができたら作業を簡単に共有して拡張できます。

オープンソースであり、さまざまなクラウドプロバイダーで利用可能

開発者向けアドバイス: ディープラーニングの実践者は、独自のソリューションを超えて進むことを選択できます。

「Determined は、クラウド プラットフォーム、オンプレミス インフラストラクチャ、またはその両方で動作します。このプラットフォームは、選択したディープラーニング フレームワークで動作し、一般的なサービス フレームワークに簡単にエクスポートできます。」

このプラットフォームを使用すると、非常に簡単な手順でプロジェクトをオープンソース化し、他のパートナーに利益をもたらすことができます。

詳細なユーザードキュメント

現在、Determined には正式なユーザー マニュアルが用意されており、ユーザーはいつでも参照することができます。

https://docs.determined.ai/latest/

シンプルで使いやすいチュートリアルもあります:

最後に、開発者は、誰でも Definitely 開発チームとコミュニケーションを取り、フィードバックやコミュニケーションを提供できるように、Slack リンクも添付しました。

プロジェクトのオープンソース アドレスは次のとおりです。興味のあるパートナーは GitHub にアクセスしてすぐに体験できます。

https://github.com/determined-ai/determined

<<:  張漢松: 大ヒットARゲームのルールを解説

>>:  「Nvidia人工呼吸器」オープンソース:コンピュータアーキテクチャのマスターによって構築され、コストが98%削減され、黄仁訓が賞賛

ブログ    

推薦する

現在の AI の誇大宣伝が行き詰まったらどうなるでしょうか?

AI が行き詰まった場合、サイバーセキュリティ業界は従来の方法、特に人間主導の方法に大きく依存し続...

Appleの会話型AI予算は1日あたり数百万ドルに拡大

海外メディアは9月7日、事情に詳しい関係者の話として、アップルが人工知能の構築に必要なコンピューティ...

Pythonとdlibを使用した顔検出

「Dlib は、高度なソフトウェアを作成するための機械学習アルゴリズムとツールの最新の C++ ツー...

データセンターで AI を活用する 5 つの理由

人工知能はかなり前から存在しており、その継続的な開発により、パフォーマンスの向上とコストの削減という...

知能ロボット技術の応用と開発動向

王耀南院士が2020年国家ロボット開発フォーラムで報告著者プロフィール:王耀南、中国工程院院士、湖南...

...

「現時点で最高のヴィンセント動画AI」が登場!広告や映画に使っても問題ない。ネットユーザー:とてもスムーズ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

20 分で回路基板の組み立て方を学びましょう!オープンソースのSERLフレームワークは、精密制御において100%の成功率を誇り、人間の3倍の速さです。

近年、四足歩行、把持、器用な操作など、ロボットの強化学習技術の分野では大きな進歩が遂げられていますが...

OpenAIはAIモデルのトレーニング用データセットを生成するパートナーを募集している

IT Homeは11月10日、OpenAIがAIモデルのトレーニング用にパブリック/プライベートデー...

人工知能に関する長期的および短期的な懸念

人工知能(AI)技術の発展により、いつか「超人」的なAIが出現する日は来るのでしょうか?もしそうなれ...

...

...

ArmとHuaweiが参入し、自動運転チップの戦いでどちらが勝つかは分からない

今年、自動運転はまだ大規模な商用化には至っていないが、利益の偏在により廃業する企業、継続が困難となり...

OpenAIの「クレイジーウィーク」の力はあらゆる分野に影響を及ぼした

先週は間違いなく、OpenAI にとっていつも以上に忙しい週でした。ユーザー数でトップクラスの生成A...

機械学習は将来どこに向かうのでしょうか?インテル・南京大学共同研究センターが答えを提供する

[51CTO.com からのオリジナル記事] 人工知能アルゴリズムに関しては、ディープラーニングが現...