ML Ops: データ品質が鍵

ML Ops は AI 分野における比較的新しい概念であり、「機械学習操作」として説明できます。モデルを効率的に開発、展開、監視できるように、データサイエンティストと運用スタッフをより適切に管理するにはどうすればよいでしょうか。データの品質は非常に重要です。

[[346458]]

この記事では、ML Ops の概要を説明し、ML Ops ワークフローにおけるデータ品質の重要な役割について説明します。

ML Ops の開発は、機械学習と従来のソフトウェアエンジニアリングの間のギャップを埋め、データ品質は ML Ops ワークフローの鍵となり、データチームの加速とデータの信頼性の維持に役立ちます。

ML Opsとは

ML Ops という用語は DevOps から発展しました。

DevOps は、開発 (アプリケーション/ソフトウェアエンジニアリング)、技術運用、品質保証 (QA) 部門間のコミュニケーション、コラボレーション、統合を促進する一連のプロセス、方法、システムです。 DevOps は、ソフトウェア開発者 (Dev) と IT 運用技術者 (Ops) 間のコミュニケーションとコラボレーションを重視する文化、運動、または実践です。ソフトウェアの配信とアーキテクチャの変更プロセスを自動化することで、ソフトウェアをより速く、より頻繁に、より確実に構築、テスト、リリースできるようになります。

一方、MLOps は、継続的インテグレーション、継続的デリバリー、継続的デプロイメントなど、ワークフローの効率を向上させる DevOps の原則とプラクティスに基づいています。 ML Ops は、次の目標を掲げて、これらの原則を機械学習プロセスに適用します。

より速くモデルを実験し開発する
モデルをより早く本番環境に導入
品質保証

DevOps の一般的な例としては、git などのツールを使用したコードのバージョン管理、コードレビュー、継続的インテグレーション (CI、つまり共有メインラインへのコードの頻繁なマージ)、自動テスト、継続的デプロイメント (CD、つまり本番環境へのコードの自動マージ) などがあります。

ML Ops を機械学習に適用すると、モデル出力の品質を確保しながら、機械学習モデルの開発と本番環境への展開を加速することを目的としています。ただし、ソフトウェア開発とは異なり、ML ではコードとデータの両方を扱う必要があります。

機械学習はデータから始まりますが、データはさまざまなソースから取得されるため、さまざまなソースからのデータをクリーンアップ、変換、および保存するためのコードが必要です。
処理されたデータはデータサイエンティストに提供され、データサイエンティストはコードを記述し、機能エンジニアリングを完了し、機械学習モデルを開発、トレーニング、テストし、最終的にこれらのモデルを運用環境に展開します。
運用環境では、ML モデルはコードとして存在し、さまざまなソースから入力データを取得し、製品やビジネスプロセスに取り込まれる出力データを作成します。

上記の説明ではプロセスが簡略化されていますが、ML 環境ではコードとデータが密接に結合されており、ML Ops は両方を処理する必要があることがわかります。

具体的には、ML Ops には次のタスクが含まれます。

データ変換とモデル定義に使用されるコードのバージョン管理。
取得したデータとモデルコードを本番環境に移行する前に自動的にテストします。
安定したスケーラブルな環境でモデルを本番環境にデプロイします。
モデルのパフォーマンスと出力を監視します。

データテストとドキュメントは ML Ops にどのように適合しますか?

ML Ops は、モデル出力の品質を確保しながら、機械学習モデルの開発と実稼働展開を加速することを目的としています。もちろん、データ品質の専門家が ML ワークフローの各段階でスピードと品質を達成するには、データのテストとドキュメント化が非常に重要です。

利害関係者側では、質の悪いデータはシステムに対する信頼に影響を与え、その結果、そのシステムに基づいた意思決定に悪影響を及ぼす可能性があります。さらに悪いことに、データ品質の問題に気付かないと誤った結論につながる可能性があり、それを修正すると多くの時間が無駄になる可能性があります。
エンジニアリング側では、下流の消費者が気付いたデータ品質の問題を急いで修正することが、チームの時間を浪費し、チームの生産性と士気を徐々に低下させる最大の問題の 1 つです。
さらに、データの文書化は、すべての関係者間でデータを伝達し、データ契約を確立するために重要です。

次のセクションでは、ML パイプラインのさまざまなステージを大まかに説明し、データテストとドキュメントが各ステージにどのように適合するかについて説明します。

1. データ収集段階

データセット処理の初期段階であっても、データの品質チェックと文書化を行うことで、長期的には操作を大幅に高速化できます。エンジニアにとって、不必要な問題を引き起こすことなくデータ取り込みパイプラインに安全に変更を加えることができる信頼性の高いデータテストが重要です。同時に、社内外の上流ソースからデータを取得する際には、取得段階でデータ検証を実行し、データに予期しない変更がないことを確認することが非常に重要です。

2. モデル開発

この記事では、コアモデル開発プロセスの一部として、特徴エンジニアリング、モデルトレーニング、モデルテストについて説明します。この継続的な反復プロセスでは、データサイエンティストをサポートするためにデータ変換コードとモデル出力に関するサポートが提供されるため、1 か所の変更によって他の部分が壊れることはありません。

従来の DevOps では、CI/CD ワークフローによる継続的なテストにより、コードの変更によって生じた問題を迅速に特定できます。さらに一歩進んで、ほとんどのソフトウェアエンジニアリングチームでは、開発者が既存のテストを使用してコードをテストするだけでなく、新しい機能を作成するときに新しいテストを追加することも要求しています。同様に、テストの実行と新しいテストの作成は、ML モデル開発プロセスの一部である必要があります。

3. モデルを本番環境で実行する

すべての ML Ops と同様に、本番環境で実行されるモデルは、信頼性の高い結果を生成するためにコードと入力データに依存します。データ取得フェーズと同様に、コードの変更や実際のデータの変更によって生じる不要な問題を回避するために、データ入力を保護する必要があります。同時に、モデルが期待どおりに動作し続けることを確認するために、モデル出力に関するテストも実行する必要があります。

特にブラックボックス ML モデルを使用する環境では、モデル出力の品質基準を確立し、維持することが重要です。同様に、モデルの予想される出力を共有領域に文書化することで、データチームと関係者が「データコントラクト」を定義して伝達できるようになり、ML パイプラインの透明性と信頼性が向上します。

オリジナルリンク: https://greatexpectations.io/blog/ml-ops-data-quality/

[この記事は51CTOコラム「Machine Heart」、WeChatパブリックアカウント「Machine Heart（id:almosthuman2014）」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<: 比較分析に基づく人工知能技術の革新の道筋に関する研究

>>: マイクロソフトの新しい画像キャプションAIは、Word、Outlook、その他のソフトウェアのアクセシビリティ向上に役立ちます。

Python が Java や C/C++ に勝って機械学習に最適な言語である理由!

ML Ops: データ品質が鍵

Python が Java や C/C++ に勝って機械学習に最適な言語である理由!

1 つの記事でニューラルネットワークを理解する

ReLU がビジュアル Transformer のソフトマックスに取って代わり、DeepMind の新しい手法でコストが急速に削減される

清華大学と中国人工知能学会が2019年人工知能開発報告書を発表

GPT-3を超えて、DeepMindは新しいお気に入りのGatoをリリースしましたが、「スープは変えても薬は変えない」と疑問視されています

自動運転には未来があるのでしょうか？

TextRankアルゴリズムを使用した自動テキスト要約

データサイエンスと人工知能はヘルスケア業界をどのように変えるのでしょうか?

2021年、人工知能は再び疫病との戦いで役割を果たすだろう

推薦する

科学者らが自己再生材料に使える3Dプリント「生きたインク」を開発

確率的隠れ層モデルに基づくショッピングペアリングプッシュ：アリババが新しいユーザー嗜好予測モデルを提案

Python の基礎: FP 成長アルゴリズムの構築

クロス検証は非常に重要です!

人工知能とビッグデータ: ビジネス価値に関するデータの洞察を発見

人工知能の今後の発展はどうなるのでしょうか？

AI アバターはブランドエンゲージメントを深める鍵となるのでしょうか?

AIビッグモデルがインテリジェント交通の未来を切り開く？

アストラゼネカはPyTorchベースのアルゴリズムを使用して新薬を発見

RedditユーザーがAppleのCSAMツールをリバースエンジニアリングし、アルゴリズムがすでに存在していることを発見

企業で AI ストレージを導入する際に留意すべき 7 つのポイント