さまざまなタスクに人工知能を導入する企業が増えるにつれ、AI モデルのトレーニングはコストがかかり、難しく、時間がかかることがすぐにわかりました。 MosaicML という企業は、こうした新たな課題に対処するための新しい方法を見つけることを目指しています。最近、MosaicML は、モデルのトレーニングを高速化し、コストを削減し、よりパフォーマンスの高いモデルを取得することを目指して、効率的なニューラル ネットワーク トレーニング用の PyTorch ライブラリ「Composer」をリリースしました。 Composer は PyTorch で記述されたオープンソース ライブラリであり、より優れたアルゴリズムを統合して、ディープラーニング モデルのトレーニングを高速化し、コストの削減と精度の向上を実現することを目的としています。現在、このプロジェクトは GitHub プラットフォームで 800 を超えるスターを獲得しています。 プロジェクトアドレス: https://github.com/mosaicml/composer Composer には、ユーザーが独自のトレーニング ループに統合できる機能インターフェイス (torch.nn. functional に類似) があり、効率的なトレーニング アルゴリズムをトレーニング ループにシームレスに統合できる Trainer も含まれています。 プロジェクトでは 20 を超える加速方法が導入されており、数行のコードでユーザーのトレーニングに適用したり、組み込みの Trainer で使用したりできます。 一般的に、Composer にはいくつかのハイライトがあります。
では、Composer を使用することでどのようなトレーニング効果の向上が図れるのでしょうか?
プロジェクト情報によると、Composer トレーニングを使用すると、次のことが可能になります。
Reddit コミュニティでは、プロジェクト作成者の Jonathan Frankle 氏が発言し、Composer は宝くじ仮説に関する彼の研究の直接的な継続であると述べました。 2019 年、Frankle 氏と Carbin 氏の「宝くじ仮説: スパースで訓練可能なニューラル ネットワークの発見」が ICLR 2019 で最優秀論文賞を受賞しました。この論文では、Frankle らは、標準的な剪定手法によって、初期化後に効率的にトレーニングできるサブネットワークが自然に発見されることを発見しました。これらの結果に基づいて、2 人は「宝くじ仮説」を提唱しました。これは、高密度でランダムに初期化されたフィードフォワード ネットワークにはサブネットワーク (「当選券」) が含まれており、これを個別にトレーニングすると、同様の反復回数で元のネットワークに匹敵するテスト精度を達成できるというものです。 現在、フランクル氏は Mosaic 社の主任科学者であり、Composer の開発の原動力となっています。 今回、フランクル氏は、ディープラーニングの背後にある「数学」には神聖なものは何もないと述べた。 「数学」を根本的に変更してもまったく問題ありません(たとえば、重みを大幅に削除するなど)。本来得られるネットワークとは異なるネットワークが得られますが、元のネットワークが「正しい」ネットワークであるわけではありません。 「計算」を変更することで、ネットワークが同様に良くなり(たとえば、同じ精度)、さらに高速化されるなら、それは成功です。 ディープラーニングの背後にある「数学」を分析したい場合は、宝くじ仮説が一例です。 Composer には、これを行うための多数のテクニックがあり、それに応じた高速化も実現されています。 同時に、プロジェクトの著者らは Composer と PyTorch Lightning も比較しました。「PyTorch Lightning は、異なる API を持つ異なるトレーニング ライブラリです。実際、私たちは最初の Composer 実装を PTL 上に構築しました。」 PyTorch Lightningの作者であるウィリアム・ファルコン氏もその後の議論に登場したが、両者は合意に達しなかったようだ。 現在、Composer のトレーナーは、Resnet-50、Resnet-101、UNet、GPT-2 のアクセラレーションを含む多くのモデルに適用できます。 作者は、今後はViT、BERT、セグメンテーション、ターゲット検出など、より多くのモデルに拡張される予定だと述べています。 |
<<: 機械学習の再考: 人工知能はどのようにして「記憶を失う」ことを学ぶのか?
導入機械学習プロジェクトに取り組むとき、すべてのデータ サイエンティストが直面しなければならない質問...
報道によると、権威ある調査機関ガートナーは本日発表したホワイトペーパーで、投資家による人工知能(AI...
国府如和の長年にわたる指導過程において、多くの学生が次のような質問をしました。機械学習は実際のビジネ...
統計によると、交通事故のほぼ主な原因は運転者の過失です。そのため、自動化は長い間、セキュリティにおけ...
無人運転車はいつ公道を走るようになるのでしょうか?この時期は私たちが考えていたよりも少し早いかもしれ...
大規模言語モデルのパラメータサイズは拡大しているものの、モデル内のパラメータがどのように機能するかを...
[[432064]]長い間、多くの学者は、ディープラーニングと人工ニューラルネットワークのインスピレ...
[[285612]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
[[280027]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...
[[391125]]エッジで AI を導入すると、ネットワークの遅延と運用コストを削減できるだけでな...