機械学習モデルの導入における課題に対処する方法

[[377893]]

[51CTO.com クイック翻訳] データとオープンソースの機械学習フレームワークが利用可能になり、アクセスしやすくなったことで、データサイエンティストや開発者は AI ベースのソリューションを構築しやすくなります。ただし、モデルの導入と、本番環境レベルのシステムに拡張するための最適な戦略の選択を検討する必要がある場合、プロセスはより複雑になります。

次のセクションでは、機械学習モデルの導入における一般的な課題について説明し、これらの課題のいくつかに対処する方法について説明します。

AI 主導の組織にとって、モデルの展開を成功させることが重要なのはなぜですか?

機械学習モデルの展開は、機械学習アルゴリズムを Web サービスに変換するプロセスです。この変換プロセスは運用化と呼ばれます。機械学習モデルの運用化とは、それを消費可能なサービスに変換し、既存の運用環境に組み込むことを意味します。

モデルのデプロイは、機械学習モデルワークフローの基本的なステップです。機械学習モデルを導入することで、組織は構築した予測モデルとインテリジェントモデルを最大限に活用し、モデルの結果に基づいてビジネスプラクティスを開発し、人工知能によって駆動される実際のビジネスへと変革することができます。

AI の導入を検討する場合、組織は、データソースと取り込み、データパイプライン、機械学習モデルのトレーニングとテスト、新しい機能の設計方法、モデルの精度を高めるために使用する変数など、機械学習ワークフローの主要コンポーネントに重点を置く必要があります。これらすべてのステップは重要です。ただし、これらのモデルとデータが時間の経過とともにどのように使用されるかを考慮することも、すべての機械学習パイプラインにおいて重要なステップです。モデルが展開され、運用されると、その予測から実際の価値とビジネス上のメリットを引き出すことができます。

モデルの正常な導入は、次の理由から AI 主導の組織にとって非常に重要です。

機械学習モデルを導入することで、チームはそのモデルを使用し、データを送信して予測を取得できるようになります。その後、その予測を機械学習システムに取り込んで、トレーニングデータの品質と量を向上させることができます。
このプロセスが開始されると、組織はより多くの機械学習モデルを構築し、本番環境に導入し始めます。開発環境からビジネス運用システムにモデルを移行するための信頼性が高く、繰り返し可能な方法を開発できます。

一部の組織がモデルの展開に苦労するのはなぜでしょうか?

多くの組織は、AI の導入をテクノロジーの実践と見なしています。しかし、これは組織内で開始されるビジネス主導の取り組みです。 AI 主導の組織になるためには、現在ビジネスを運営し理解している組織内の人々が、機械学習の展開ワークフローを担当するチームと緊密に連携し始めることが重要です。

機械学習の導入ワークフローの各ステップは、導入を成功させるために使用する必要があるさまざまなツールとサービスに関する具体的な決定に基づいています (モデルのトレーニングと登録からモデルの導入と監視まで)。

AI アプリケーション開発プロセスを開始するときは、機械学習チームがビジネス担当者と連携する必要があります。モデルの展開および使用手順と並行して、モデルの実験プロセスを理解するために、継続的な対話を維持する必要があります。ほとんどの組織は、機械学習の可能性を活用して運用プロセスを最適化し、データサイエンティスト、アナリスト、ビジネスチームが同じ言語で話せるようにすることに苦労しています。

さらに、機械学習モデルは履歴データに基づいてトレーニングする必要があります。予測データパイプラインを作成する必要があります。これは、データ処理、機能エンジニアリング、最適化などの複数のタスクを必要とするアクティビティです。データベースのバージョン管理から欠損値の処理まで、すべてのタスクは開発から本番まで正確に複製する必要があります。場合によっては、開発と本番で使用されるテクノロジの違いにより、機械学習モデルの導入が困難になることがあります。

組織は機械学習パイプラインを使用して、機械学習の各段階を結び付けるワークフローを作成および管理できます。たとえば、機械学習パイプラインには、データの準備、モデルのトレーニング、モデルの展開、推論/スコアリングの各段階が含まれる場合があります。各ステージは複数のステップで構成でき、各ステップは人間の介入なしにさまざまなコンピューティングターゲットで実行できます。パイプラインステップは再利用可能であり、ステップの出力が変更されていない場合は、後続のステップを再度実行せずに実行できます。機械学習パイプラインを使用すると、データサイエンティストは機械学習ワークフローのさまざまな領域で作業しながら共同作業を行うこともできます。

モデルを正常に展開するために適切なツールを選択するにはどうすればよいでしょうか?

人工知能を使用して業務を変革しようとしている組織にとって、機械学習モデルの構築、トレーニング、テスト、そして最終的な導入は、面倒なプロセスになることがよくあります。また、数か月の開発期間を経て単一のアルゴリズムに基づく機械学習モデルが完成したとしても、経営陣はデータサイエンティストが優れたモデルを作成したかどうか、またそのモデルをどのように拡張して運用化すればよいのかを把握していないことがよくあります。

ここでは、組織が展開モデルを成功させるために適切なツールを選択する方法に関するガイドラインを示します。このワークフローは Azure Machine Learning サービスを使用して説明されますが、組織が選択した機械学習製品でも使用できます。

モデル展開ワークフローは、次の 3 つの簡単な手順に基づく必要があります。

1. モデルを登録する

登録されたモデルは、モデルを構成する 1 つ以上のファイルの論理コンテナーです。たとえば、組織に複数のファイルに保存されたモデルがある場合、それらをワークスペースに 1 つのモデルとして登録できます。登録後、登録したモデルをダウンロードまたはデプロイし、登録したすべてのファイルを受信できるようになります。

Azure Machine Learning ワークスペースを作成するときに、機械学習モデルを登録できます。モデルは、Azure Machine Learning または他の場所から取得できます。

2. 展開の準備 (資産、目的、コンピューティングターゲットを指定する)。

モデルを Web サービスとしてデプロイするには、推論構成とデプロイ構成を作成する必要があります。推論、またはモデルスコアリングは、展開されたモデルが通常は実稼働データに対して予測に使用される段階です。推論構成では、組織はモデルを提供するために必要なスクリプトと依存関係を指定します。デプロイメント構成では、コンピューティングターゲットでモデルを提供する方法の詳細を指定します。

入力スクリプトは、デプロイされた Web サービスに送信されたデータを受信し、それをモデルに渡します。モデルによって返された応答を取得してクライアントに返すことができます。スクリプトは組織のモデルに固有のものであり、モデルが期待して返すデータを理解する必要があります。

スクリプトには、モデルを読み込んで実行するための 2 つの関数が含まれています。

init(): 通常、この関数はモデルをグローバルオブジェクトに読み込みます。この関数は、Web サービスの Docker コンテナが起動されたときに 1 回だけ実行されます。
run(input_data): この関数はモデルを使用して、入力データに基づいて値を予測します。実行される入力と出力は通常、JSON を使用してシリアル化および逆シリアル化されます。組織は生のバイナリデータも処理できます。生のバイナリデータは、モデルに送信する前、またはクライアントに返す前に変換できます。

モデルを登録するときは、レジストリでモデルを管理するためにモデル名を指定する必要があります。組織はモデルにこの名前を使用します。 get_model_path() は、ローカルファイルシステム上のモデルファイルへのパスを取得します。フォルダーまたはファイルのコレクションを登録すると、この API はそれらのファイルを含むディレクトリへのパスを返します。

3. モデルをコンピューティングターゲットにデプロイする

最後に、展開前に、組織は展開構成を定義する必要があります。デプロイメント構成は、Web サービスをホストするコンピューティングターゲットに固有です。たとえば、ローカルにデプロイする場合は、サービスがリクエストを受け入れるポートを指定する必要があります。

結論は

この記事では、機械学習モデルの導入における一般的な課題をいくつか紹介しました。また、AI の可能性を最大限に引き出すためにモデルを正常に導入することがなぜ重要なのか、組織がモデルを導入する際に直面する困難、モデルを正常に導入するための適切なツールの選択についても説明しました。

原題: ML モデルの導入における課題への取り組み方、著者: Rajasekhar Reddy Polu

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<: 2020 年の世界トップ 10 AI ガバナンスイベント

>>: 5Gは医療業界に革命を起こす