ディープラーニング モデルを本番環境に導入することは、優れたパフォーマンスのモデルをトレーニングするだけでは不十分であるため、困難な場合があります。実稼働レベルのディープラーニング システムを導入するには、多数のコンポーネントを適切に設計および開発する必要があります。この記事では、実際のアプリケーションに導入される本番環境レベルのディープラーニング システムを構築するための GitHub のエンジニアリング ガイドを紹介します。 この記事では、実稼働レベルのディープラーニング システムのさまざまな構成要素を詳しく見ていき、各コンポーネントに適したツールセットとフレームワーク、および実践者が提供するベスト プラクティスを推奨します。 1. データ管理1.1. データソース オープンソースデータ(良いスタートだが、有利ではない)、データ拡張、合成データ 1.2. 注釈 注釈付き労働力源:
注釈プラットフォーム:
1.3. ストレージ データ保存オプション: (1)オブジェクトストレージ:バイナリデータ(画像、音声ファイル、圧縮テキスト)の保存
(2)データベース:メタデータ(ファイルパス、タグ、ユーザーアクティビティなど)を保存します。
(3)データレイク:データベースからは取得できない特徴(ログなど)を集約するために使用される。
(4)特徴量保存:機械学習の特徴量の保存とアクセス。
バージョン管理
1.5. 処理 実稼働モデルのトレーニング データは、データベースやオブジェクト ストレージに保存されたデータ、ログ処理、他の分類子からの出力など、さまざまなソースから取得される場合があります。 タスク間には依存関係があり、各キャラクターは依存関係が完了した後にのみ開始できます。たとえば、新しいログ データをトレーニングするには、トレーニングの前に前処理が必要です。したがって、この点ではワークフローが非常に重要になります。 ワークフロー:
2. 開発、研修、評価ソフトウェアエンジニアリング エディタ:
提案: 個人またはスタートアップ向け:
大企業の場合:
2.2. リソース管理 プログラムに空きリソースを割り当てます。 リソース管理オプション:
2.3. ディープラーニングフレームワーク 特別な理由がない限り、TensorFlow/Keras または PyTorch を使用してください。次の図は、開発と運用におけるさまざまなフレームワークの比較を示しています。 2.4. 実験管理 戦略を開発、トレーニング、評価する: 常にシンプルに始めます。小さなバッチで小さなモデルをトレーニングし、それが機能する場合にのみ、より大きなデータとモデルにスケールアップし、ハイパーパラメータの調整を実行します。 実験管理ツール:
2.5. ハイパーパラメータの調整 Hyperas: シンプルなテンプレート表記を使用して、調整するハイパーパラメータの範囲を定義する、Keras 用の hyperopt のシンプルなラッパーです。 SIGOPT: スケーラブルなエンタープライズレベルの最適化プラットフォーム。 Ray-Tune: スケーラブルな分散モデル選択研究プラットフォーム (ディープラーニングとディープ強化学習に重点を置いたもの)。重みとバイアスからのスイープ: パラメータは開発者によって明示的に指定されませんが、機械学習モデルによって近似され、学習されます。 2.6. 分散トレーニング データ並列処理: 反復処理に時間がかかりすぎる場合に使用します (TensorFlow と PyTorch の両方でサポートされています)。 モデルの並列処理: モデルが単一の GPU に収まらない場合に使用されます。 その他の解決策:
3. トラブルシューティングは「改善が必要」4. テストと展開4.1. テストとCI/CD 機械学習の生産ソフトウェアには、従来のソフトウェアよりも多様なテスト スイートが必要です。 ユニットテストと統合テスト テストタイプ:
継続的インテグレーションのための SaaS:
4.2. ネットワーク展開 (1)予測システムとサービスシステムから構成される
(2)サービスオプション:
(3)モデルサービス:
(4)意思決定:
4.3 サービスメッシュとトラフィックルーティング モノリシック アプリケーションから分散マイクロサービス アーキテクチャへの移行は困難な場合があります。 サービス メッシュ (マイクロサービスのネットワークで構成) は、このようなデプロイメントの複雑さを軽減し、開発チームの負担を軽減します。 Istio: サービス内のコードをほとんどまたはまったく変更せずに、デプロイされたサービスのネットワークの作成を簡素化するサービス メッシュ テクノロジー。 監視 目的:
さらに、クラウドプロバイダーが提供するソリューションも非常に優れています。 4.5. 組み込みデバイスおよびモバイルデバイスへの展開 主な課題: メモリ使用量と計算上の制限 解決:
組み込みおよびモバイル フレームワーク:
モデル変換:
4.6. 統合ソリューション
Tensorflow 拡張 (TFX) Airflow と KubeFlow ML パイプライン |
<<: あなたのお子さんは「顔スキャン」されましたか?顔認識技術がキャンパスに導入され物議を醸す
>>: AI企業の成人式:自由が996と衝突し、技術的理想が地上戦争と衝突する
すべてのアプリにおいて、製品自体が登場する前、アイデアが生まれた時点で、すでに製品マーケティングの問...
IBM と Meta のパートナーおよび協力者には、AMD、Intel、NASA、CERN、Hugg...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
2018年、国内の人工知能とビッグデータ産業は引き続き急速な発展を遂げ、国家計画の導入に伴い、各地...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[252430]]ビッグデータダイジェスト制作編纂者:江宝尚今年 9 月に開催された Deep L...
[[183562]]人々は常に人工知能について多くの懸念を抱いています。人工知能は私たちの仕事にとっ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
COVID-19のパンデミックにより、私たちはテクノロジー、オンライン活動、人工知能への依存をさら...
1. TFservingとは何かモデルをトレーニングし、それを外部の関係者に提供する必要がある場合は...
著者 | 真実を追求する実践主義者人工知能が発展し続けるにつれて、セキュリティとコンプライアンスの問...
人工知能(AI)技術の発展により、いつか「超人」的なAIが出現する日は来るのでしょうか?もしそうなれ...
セキュリティにおける人工知能の応用は、人々に 4 つの独自のセキュリティ上の利点をもたらします。この...