機械学習におけるモデル展開とは何ですか?

機械学習におけるモデル展開とは何ですか?

機械学習におけるモデルのデプロイメントとは、機械学習モデルを既存の運用環境に統合し、入力を受け入れて出力を返すプロセスです。目標は、トレーニングされた機械学習モデルの予測を他の人が利用できるようにすることです。

ほとんどのオンライン リソースは、探索的データ分析 (EDA)、モデルの選択、モデルの評価など、機械学習ライフサイクルの初期ステップに重点を置いています。ただし、モデルの展開は複雑になる可能性があるため、ほとんど議論されないトピックのようです。ソフトウェア エンジニアリングや DevOps の経験がない人にとって、デプロイメントを理解するのは困難です。

この記事では、モデルのデプロイメントの概要、モデルの高レベルアーキテクチャ、モデルをデプロイするさまざまな方法、およびデプロイメント方法を決定する際に考慮すべき要素について詳しく説明します。

モデルのデプロイメントとは何ですか?

機械学習モデルのデプロイ (モデル デプロイとも呼ばれます) とは、モデルが入力を受け入れて出力を返すことができる既存の運用環境に機械学習モデルを統合することを意味します。モデルを展開する目的は、他の人 (ユーザー、管理者、または他のシステム) がトレーニングされた機械学習モデルを使用して予測を行えるようにすることです。

モデルの展開は機械学習システム アーキテクチャと密接に関連しており、事前定義された目標を達成するためにシステム内のソフトウェア コンポーネントの配置と相互作用を指します。

モデル展開標準

モデルをデプロイする前に、機械学習モデルがデプロイの準備としていくつかの基準を満たす必要があります。

  • 移植性:これは、ソフトウェアをあるマシンまたはシステムから別のマシンまたはシステムに転送できる能力を指します。ポータブル モデルとは、応答時間が比較的速く、簡単に書き換えることができるモデルです。
  • スケーラビリティ:モデルを拡張できる範囲を指します。スケーラブルなモデルとは、再設計せずにパフォーマンスを維持できるモデルです。

これらはすべて、ソフトウェアやその他の製品が実際に運用され、エンドユーザーが使用する環境を表す用語である実稼働環境で行われます。

モデル展開のための機械学習システムアーキテクチャ

大まかに言えば、機械学習システムには 4 つの主要な部分があります。

  • データ レイヤー: データ レイヤーは、モデルに必要なすべてのデータ ソースへのアクセスを提供します。
  • フィーチャ レイヤー: フィーチャ レイヤーは、透過的かつスケーラブルで使いやすい方法でフィーチャ データを生成する役割を担います。
  • スコアリング レイヤー: スコアリング レイヤーは、特徴を予測に変換します。 Scikit-Learn は最も一般的に使用されており、スコアリングの業界標準です。
  • 評価レイヤー: 評価レイヤーは 2 つのモデルの同等性をチェックし、実稼働モデルを監視するために使用できます。これは、トレーニング予測が実際のトラフィック予測とどの程度一致するかを監視および比較するために使用されます。

知っておくべき3つのモデル展開方法

ML モデルをデプロイするための一般的なアプローチには、ワンショット、バッチ、リアルタイムの 3 つがあります。

1. 1回限り

展開のために機械学習モデルを継続的にトレーニングする必要は必ずしもありません。モデルは一度だけ、または定期的に必要になる場合があります。この場合、モデルは必要に応じてアドホックにトレーニングされ、パフォーマンスが低下して修復が必要になるまで実稼働状態にすることができます。

2. バッチ

バッチトレーニングを使用すると、モデルの最新バージョンを継続的に使用できます。これは、一度にデータのサブサンプルを取得するスケーラブルなアプローチであり、更新ごとに完全なデータセットを使用する必要がなくなります。モデルを一貫して使用するが、必ずしもリアルタイムの予測が必要ない場合には、このアプローチが適しています。

3. リアルタイム

場合によっては、取引が不正であるかどうかを判断するなど、リアルタイムの予測が必要になります。これは、確率的勾配降下法を使用した線形回帰などのオンライン機械学習モデルを使用することで実現できます。

考慮すべき4つのモデル展開要素

機械学習モデルの展開方法を決定する際に考慮すべき要素や影響は数多くあります。これらの要因には次のものが含まれます。

  • 予測が生成される頻度と予測結果がどの程度緊急に必要か。
  • 予測を個別に生成するか、バッチで生成するか。
  • モデルのレイテンシ要件、保有するコンピューティング能力、必要なサービス レベル アグリーメント (SLA)。
  • モデルの導入と維持に必要な運用上の影響とコスト。

これらの要素を理解することで、1 回限り、バッチ、リアルタイムのモデル展開アプローチの中から選択できるようになります。

<<: 

>>:  AIが将来のスマートマスモビリティソリューションへの道を切り開く

ブログ    

推薦する

...

Transformerが3Dモデリングに革命を起こし、MeshGPT生成結果がプロのモデラーやネットユーザーに衝撃を与える:革命的なアイデア

コンピュータグラフィックスでは、「三角メッシュ」は 3D 幾何学的オブジェクトの主な表現であり、ゲー...

CPU、TPU、GPU、DPU、QPUについて学ぶ

AIの人気に伴い、CPU、TPU、GPU、DPU、QPUなどの略語がさまざまなメディアで飛び交ってい...

生成AIスタートアップにとっての大きな問題は、資金不足ではなくトレーニングデータの不足だ

6月16日、生成型人工知能のスタートアップ企業数社が数十億ドルの資金を調達したが、適切なデータを入手...

オンラインゲームの依存症対策システムは「破られた」のか?記者調査:ネット上で「顔認証」サービスを提供、実名なしでゲームにログインできると主張

現代速報(記者:季宇江南)未成年者がオンラインゲームに依存しないようにするため、依存防止制度が生まれ...

人工知能と機械学習: フィンテック業界の新たな青写真

企業は AI と機械学習を十分に活用していません。フィンテック業界で人工知能(AI)と機械学習(ML...

...

大規模言語モデルによる金融市場の予測

大規模言語モデル (LLM) は、数百万または数十億のパラメータを持つ人工ニューラル ネットワークで...

人工知能の将来の展望と動向は何でしょうか?

AlphaGo の人間と機械の戦いから、自動運転車のロードトリップ、AI 合成アンカーの採用まで、...

...

スマートシティ交通ソリューションへのテクノロジーの影響

インテリジェントな交通管理システムは、スマートシティの開発に欠かせない要素です。具体的には、スマート...

2018 年の画期的なテクノロジー トップ 10: AI と知覚都市

2017年、MITテクノロジーレビューは、強化学習、自動運転トラック、360度セルフィー、顔認証決済...

...

信じられない!中国はわずか3年で人工知能の分野で大きな成果を上げた

計算知能から知覚知能、そして認知知能へと、人工知能の鍋はついに沸騰しようとしています。最近、3E 2...

今後数年間の AI テクノロジーの分野で最も注目される新しい方向性は何でしょうか?

近年、AI の分野を調査しているうちに、世界中の研究者の視野の中に敵対的攻撃という概念が徐々に現れて...