MLOps 実装を成功させるためのベストプラクティス

MLOps 実装を成功させるためのベストプラクティス

翻訳者 | ブガッティ

企画 | 梁策、孫淑娟

機械学習と今日の世界におけるその応用については、すでにご存知かもしれません。人工知能 (AI) と機械学習 (ML) は、結果を正確に予測し、通常は人間が実行するタスクを自動化できるインテリジェント ソフトウェアの開発を促進します。機械学習をアプリケーションに組み込むことは重要ですが、組織にとって機械学習がスムーズに実行されるようにすることがさらに重要です。

これを実現するために、多くの企業は機械学習運用 (MLOps) と呼ばれる一連のベストプラクティスを活用しています。そして、MLOps はあらゆるビジネスの将来の繁栄にとって重要になりつつあります。デロイトによれば、市場は2025年までに40億ドルに拡大する可能性があり、これは2019年以来ほぼ12倍の増加となる。

機械学習は多くのビジネスプロセスにメリットをもたらしますが、多くの企業は依然として生産性向上のための ML 手法の実装に苦労しています。

MLOps のベストプラクティスとその適用方法とは?

新しい SaaS プロバイダーにサインアップしたり、新しいクラウド コンピューティング インスタンスを作成したりするだけで、MLOps が機能すると想定しないでください。慎重な準備と、チームや部門全体での統一されたアプローチが必要です。 MLOps 実装を成功させるためのベスト プラクティスをいくつか紹介します。

1. 複数の市場セグメントにわたってモデルを検証する

モデルは再利用可能ですが、ソフトウェアは再利用できません。モデルの有用性は徐々に低下するため、再トレーニングが必要になります。新しい状況ごとにモデルを調整する必要があり、このタスクを実行するにはトレーニング パイプラインが必要です。

トライアルモニタリングはモデルのバージョン管理と再現性の管理に役立ちますが、モデルを使用する前に検証することも重要です。

オフラインまたはオンラインの検証は、企業が優先順位に応じて使用できるオプションです。テスト データセットを使用して、精度や正確さなどの指標に重点を置き、ビジネス目標を達成するためのモデルの適合性を評価します。アップグレードを決定する前に、メトリックを現在の運用/ベースライン モデルと比較する必要があります。

実験がメタデータの観点から適切に追跡および管理されていれば、アップグレードやロールバックを簡単に実行できます。この記事では、A/B テストを使用してオンライン モデルを検証し、実際のデータに対して適切に機能するかどうかを確認する方法について説明します。

機械学習システムは、データから得られるバイアスをますます認識するようになっています。一例として、一部のユーザーにとって機能しなかった Twitter の画像切り抜きツールが挙げられます。モデルのパフォーマンスをさまざまなユーザー グループと比較することで、このような不正確さを発見して修正できます。モデルのパフォーマンスをさまざまなデータセットでテストし、要件を満たしていることを確認する必要もあります。

2. 新しいことに挑戦し、結果を追跡する

ハイパーパラメータ検索と特徴エンジニアリングは進化している分野です。 ML チームの目標は、最先端の技術と常に変化するデータ パターンを考慮して、可能な限り最高のシステムを作成することです。

ただし、そのためには最新のトレンドや標準に遅れずについていく必要があります。さらに、これらの概念をテストして、機械学習システムのパフォーマンスが向上するかどうかを確認します。

データ、コード、ハイパーパラメータはすべて実験に使用できます。変数の可能な組み合わせごとに、他の実験の結果と比較できるメトリックが生成されます。調査が実施される状況によっても結果が変わる可能性があります。

また、タイムリーな結果を保証し、各プロジェクトに費やされた時間を追跡するために、時間追跡ソフトウェアを導入することもできます。

3. MLOpsの成熟度を理解する

Microsoft や Google などの主要なクラウド プロバイダーは、MLOps の導入に成熟モデルを使用しています。

MLOps を実装するには、組織の変更と新しい作業方法が必要です。これは、組織のシステムと手順が改善され始めると徐々に起こります。

MLOps の実装を成功させるには、組織の MLOps 成熟度の進捗状況を正直に評価する必要があります。効果的な成熟度評価を実施した後、企業は新しい成熟度レベルに移行する方法を学ぶことができます。デプロイメント プロセスの変更 (DevOps の実装や新しいチーム メンバーの参加など) もこの一部です。

機械学習用のデータを保存する方法は、特徴ストアなどさまざまなものがあります。機能ストアは、データ インフラストラクチャが十分に開発された組織に役立ちます。異なるデータ チームが同じ機能を使用し、作業の重複を減らすようにする必要があります。組織にデータ サイエンティストやアナリストが少数しかいない場合は、機能ストアを導入する価値がない可能性があります。

組織は MLOps 成熟モデルを活用して、テクノロジー、プロセス、チームを一体的に成熟させることができます。実装前にツールを反復してテストする可能性が確保されます。

4. 費用対効果分析を実施する

MLOps が組織に何をもたらすかを理解してください。次回の購入時に戦略に従うと、各取引を効率的に処理できます。あなたが車を選ぼうとしている車の購入者だとしましょう。スポーツカー、SUV、コンパクトカー、高級車など、選択肢は数多くあります。まず、自分のニーズに最も適したカテゴリーを選択し、購入する車が自分のニーズを満たしていることを確認し、次に予算に基づいてさまざまなカテゴリーとモデルを分析する必要があります。

企業に最適な MLOps テクノロジーを選択する場合も同様です。たとえば、スポーツカーと SUV にはそれぞれ異なる長所と短所があります。同様に、いくつかの MLOps ツールの長所と短所を分析できます。

情報に基づいた戦略的決定を下すには、会社の予算と目標、実施する予定の MLOps アクティビティ、処理する予定のデータセットのソースと形式、チームの能力など、いくつかの変数を考慮する必要があります。

5. コミュニケーションチャネルをオープンに保つ

製品マネージャーと UX デザイナーは、システムをサポートする製品が顧客とどのようにやり取りするかに影響を与えます。機械学習エンジニア、DevOps エンジニア、データ サイエンティスト、データ視覚化の専門家、ソフトウェア開発者が協力して、長期的な機械学習システムを実装および管理する必要があります。

従業員のパフォーマンスは管理者と事業主によって確認および認定され、コンプライアンス専門家は活動が会社のポリシーと規制基準に準拠していることを確認します。

変化するユーザー、データ パターン、期待に直面しても機械学習システムがビジネス目標を達成し続けるには、それらを接続する必要があります。

6. ワークフローに自動化を組み込む

広範囲かつ高度な自動化により、企業の MLOps 成熟度は高まる可能性があります。 MLOps が不足している環境では、多くの機械学習タスクを手動で実行する必要があります。これには、特徴エンジニアリング、データのクリーニングと変換、トレーニング データとテスト データの小さなチャンクへの分割、モデル トレーニング コードの構築などが含まれます。

データ サイエンティストはこれらのタスクを手動で実行するので、エラーが発生しやすくなり、調査に費やすことができた時間が無駄になります。

継続的な再トレーニングは自動化の典型的な例であり、データ アナリストが検証、データ取り込み、機能エンジニアリング、実験、モデル テストのためのパイプラインを設定する場合があります。継続的な再トレーニングはモデルのドリフトを防ぎ、自動化された機械学習の初期ステップとしてよく見られます。

オリジナルリンク: https://www.kdnuggets.com/2022/04/mlops-best-practices-apply.html

<<:  機械学習をプログラマーにとってより身近なものにする方法

>>:  模倣学習: ロボットはプログラミングなしで自然言語を理解できます!

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

AI全盛の時代、機械翻訳はどのように革命を起こすのか?

人工知能の長年の目標は、これまで人間のみが実行していたタスクを機械が実行できるようにすることです。し...

機械学習プロセスにおける3つの落とし穴、どれを踏んでしまったか確認しましょう

[[273444]]ビッグデータダイジェスト制作編集者: Vicky、Cao Peixin機械学習の...

...

ビジネスに人工知能を導入する際に考慮すべき3つの要素

最近、ますます多くの企業が人工知能に投資しています。しかし、成功するには、推論の解釈可能性、データ密...

LLM で会話インターフェースを設計するにはどうすればいいですか?

著者:ヴァルン・シェノイ編纂者:王睿平大規模言語モデル (LLM) で構築されたテキスト ボックスの...

自然言語処理におけるAIの未来を探る

自然言語処理 (NLP) 機能の向上により、認知機能と人間同士のやり取りが向上し、それが AI の将...

エネルギー分野における人工知能の機会と課題

エネルギー部門は、現代経済において最も強力かつ収益性の高い部門の 1 つです。しかし、ほとんどのエネ...

...

...

人工知能チュートリアル(IV):確率論入門

このシリーズの前回の記事では、行列と線形代数についてさらに詳しく説明し、JupyterLab を使用...

ロボティック プロセス オートメーションの 10 の秘密

[[394728]] [51CTO.com クイック翻訳]すべての優れた SF ストーリーには、ロボ...

企業はどのように人工知能を導入し、そこから価値を得ることができるのでしょうか?

人工知能は近い将来、私たちの日常生活を変えるでしょう。企業は来たるイノベーションの波から価値を獲得す...

柯潔対中国「星陣囲碁」人機対決が今月福州で開催

今月27日、柯潔は福州で再び人工知能と対戦する。対戦相手は中国出身の「Golaxy」。 StarAr...