機械学習モデルの導入における課題に対処する方法

機械学習モデルの導入における課題に対処する方法

[[377893]]

[51CTO.com クイック翻訳] データとオープンソースの機械学習フレームワークが利用可能になり、アクセスしやすくなったことで、データ サイエンティストや開発者は AI ベースのソリューションを構築しやすくなります。ただし、モデルの導入と、本番環境レベルのシステムに拡張するための最適な戦略の選択を検討する必要がある場合、プロセスはより複雑になります。

次のセクションでは、機械学習モデルの導入における一般的な課題について説明し、これらの課題のいくつかに対処する方法について説明します。

AI 主導の組織にとって、モデルの展開を成功させることが重要なのはなぜですか?

機械学習モデルの展開は、機械学習アルゴリズムを Web サービスに変換するプロセスです。この変換プロセスは運用化と呼ばれます。機械学習モデルの運用化とは、それを消費可能なサービスに変換し、既存の運用環境に組み込むことを意味します。

モデルのデプロイは、機械学習モデル ワークフローの基本的なステップです。機械学習モデルを導入することで、組織は構築した予測モデルとインテリジェントモデルを最大限に活用し、モデルの結果に基づいてビジネスプラクティスを開発し、人工知能によって駆動される実際のビジネスへと変革することができます。

AI の導入を検討する場合、組織は、データ ソースと取り込み、データ パイプライン、機械学習モデルのトレーニングとテスト、新しい機能の設計方法、モデルの精度を高めるために使用する変数など、機械学習ワークフローの主要コンポーネントに重点を置く必要があります。これらすべてのステップは重要です。ただし、これらのモデルとデータが時間の経過とともにどのように使用されるかを考慮することも、すべての機械学習パイプラインにおいて重要なステップです。モデルが展開され、運用されると、その予測から実際の価値とビジネス上のメリットを引き出すことができます。

モデルの正常な導入は、次の理由から AI 主導の組織にとって非常に重要です。

  • 機械学習モデルを導入することで、チームはそのモデルを使用し、データを送信して予測を取得できるようになります。その後、その予測を機械学習システムに取り込んで、トレーニング データの品質と量を向上させることができます。
  • このプロセスが開始されると、組織はより多くの機械学習モデルを構築し、本番環境に導入し始めます。開発環境からビジネス運用システムにモデルを移行するための信頼性が高く、繰り返し可能な方法を開発できます。

一部の組織がモデルの展開に苦労するのはなぜでしょうか?

多くの組織は、AI の導入をテクノロジーの実践と見なしています。しかし、これは組織内で開始されるビジネス主導の取り組みです。 AI 主導の組織になるためには、現在ビジネスを運営し理解している組織内の人々が、機械学習の展開ワークフローを担当するチームと緊密に連携し始めることが重要です。

機械学習の導入ワークフローの各ステップは、導入を成功させるために使用する必要があるさまざまなツールとサービスに関する具体的な決定に基づいています (モデルのトレーニングと登録からモデルの導入と監視まで)。

AI アプリケーション開発プロセスを開始するときは、機械学習チームがビジネス担当者と連携する必要があります。モデルの展開および使用手順と並行して、モデルの実験プロセスを理解するために、継続的な対話を維持する必要があります。ほとんどの組織は、機械学習の可能性を活用して運用プロセスを最適化し、データ サイエンティスト、アナリスト、ビジネス チームが同じ言語で話せるようにすることに苦労しています。

さらに、機械学習モデルは履歴データに基づいてトレーニングする必要があります。予測データ パイプラインを作成する必要があります。これは、データ処理、機能エンジニアリング、最適化などの複数のタスクを必要とするアクティビティです。データベースのバージョン管理から欠損値の処理まで、すべてのタスクは開発から本番まで正確に複製する必要があります。場合によっては、開発と本番で使用されるテクノロジの違いにより、機械学習モデルの導入が困難になることがあります。

組織は機械学習パイプラインを使用して、機械学習の各段階を結び付けるワークフローを作成および管理できます。たとえば、機械学習パイプラインには、データの準備、モデルのトレーニング、モデルの展開、推論/スコアリングの各段階が含まれる場合があります。各ステージは複数のステップで構成でき、各ステップは人間の介入なしにさまざまなコンピューティング ターゲットで実行できます。パイプライン ステップは再利用可能であり、ステップの出力が変更されていない場合は、後続のステップを再度実行せずに実行できます。機械学習パイプラインを使用すると、データ サイエンティストは機械学習ワークフローのさまざまな領域で作業しながら共同作業を行うこともできます。

モデルを正常に展開するために適切なツールを選択するにはどうすればよいでしょうか?

人工知能を使用して業務を変革しようとしている組織にとって、機械学習モデルの構築、トレーニング、テスト、そして最終的な導入は、面倒なプロセスになることがよくあります。また、数か月の開発期間を経て単一のアルゴリズムに基づく機械学習モデルが完成したとしても、経営陣はデータ サイエンティストが優れたモデルを作成したかどうか、またそのモデルをどのように拡張して運用化すればよいのかを把握していないことがよくあります。

ここでは、組織が展開モデルを成功させるために適切なツールを選択する方法に関するガイドラインを示します。このワークフローは Azure Machine Learning サービスを使用して説明されますが、組織が選択した機械学習製品でも使用できます。

モデル展開ワークフローは、次の 3 つの簡単な手順に基づく必要があります。

1. モデルを登録する

登録されたモデルは、モデルを構成する 1 つ以上のファイルの論理コンテナーです。たとえば、組織に複数のファイルに保存されたモデルがある場合、それらをワークスペースに 1 つのモデルとして登録できます。登録後、登録したモデルをダウンロードまたはデプロイし、登録したすべてのファイルを受信できるようになります。

Azure Machine Learning ワークスペースを作成するときに、機械学習モデルを登録できます。モデルは、Azure Machine Learning または他の場所から取得できます。

2. 展開の準備 (資産、目的、コンピューティング ターゲットを指定する)。

モデルを Web サービスとしてデプロイするには、推論構成とデプロイ構成を作成する必要があります。推論、またはモデル スコアリングは、展開されたモデルが通常は実稼働データに対して予測に使用される段階です。推論構成では、組織はモデルを提供するために必要なスクリプトと依存関係を指定します。デプロイメント構成では、コンピューティング ターゲットでモデルを提供する方法の詳細を指定します。

入力スクリプトは、デプロイされた Web サービスに送信されたデータを受信し、それをモデルに渡します。モデルによって返された応答を取得してクライアントに返すことができます。スクリプトは組織のモデルに固有のものであり、モデルが期待して返すデータを理解する必要があります。

スクリプトには、モデルを読み込んで実行するための 2 つの関数が含まれています。

  • init(): 通常、この関数はモデルをグローバル オブジェクトに読み込みます。この関数は、Web サービスの Docker コンテナが起動されたときに 1 回だけ実行されます。
  • run(input_data): この関数はモデルを使用して、入力データに基づいて値を予測します。実行される入力と出力は通常、JSON を使用してシリアル化および逆シリアル化されます。組織は生のバイナリ データも処理できます。生のバイナリ データは、モデルに送信する前、またはクライアントに返す前に変換できます。

モデルを登録するときは、レジストリでモデルを管理するためにモデル名を指定する必要があります。組織はモデルにこの名前を使用します。 get_model_path() は、ローカル ファイル システム上のモデル ファイルへのパスを取得します。フォルダーまたはファイルのコレクションを登録すると、この API はそれらのファイルを含むディレクトリへのパスを返します。

3. モデルをコンピューティングターゲットにデプロイする

最後に、展開前に、組織は展開構成を定義する必要があります。デプロイメント構成は、Web サービスをホストするコンピューティング ターゲットに固有です。たとえば、ローカルにデプロイする場合は、サービスがリクエストを受け入れるポートを指定する必要があります。

結論は

この記事では、機械学習モデルの導入における一般的な課題をいくつか紹介しました。また、AI の可能性を最大限に引き出すためにモデルを正常に導入することがなぜ重要なのか、組織がモデルを導入する際に直面する困難、モデルを正常に導入するための適切なツールの選択についても説明しました。

原題: ML モデルの導入における課題への取り組み方、著者: Rajasekhar Reddy Polu

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  2020 年の世界トップ 10 AI ガバナンス イベント

>>:  5Gは医療業界に革命を起こす

ブログ    
ブログ    

推薦する

このロボットは脳コンピューターインターフェース手術を行い、マスクのニューラリンクは大きな注目を集めている

近年、マスク氏の脳コンピューターインターフェース研究会社ニューラリンクが注目を集めている。 2019...

2Dを3Dにするには、たった2枚の写真だけが必要です。このAIは、ろうそくを吹き消すプロセスを想像することができます。第一著者と第二著者はともに中国人です。

廃棄フィルム2枚がパチンと貼り合わされました!見逃した素晴らしい瞬間をすぐに蘇らせることができ、効果...

2025年以降の人工知能の未来(パート1)

[[420733]] 2025 年までに、人工知能 (AI) は、今日の複雑なタスクの一部を効率的...

...

ChatGPTは個人のカスタマイズをサポートします!長いプロンプトに別れを告げ、まずは自己紹介をしましょう

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

...

ハイリアンと手を携えてデジタル変革の道を議論する

モバイルインターネットの発展に伴い、企業の生産・運営プロセスで生成されるデータは、これまでにない爆発...

新しい形の人工知能が登場: AIaaSについてお話しましょう

「サービスとしての」配信モデルの誕生以来、SaaS と PaaS は日常的な技術用語の一部となり、企...

...

自動運転システムにおけるエッジコンピューティング技術

エッジ コンピューティングは、ネットワークのエッジでコンピューティングを実行する新しいコンピューティ...

5G+ロボットが炭鉱のインテリジェント開発を加速します!

最近、山西省太原でインテリジェント炭鉱・安全生産フォーラムが盛大に開催され、炭鉱のインテリジェント建...

Facebookが削除した10億の顔情報は、インターネット上の単なる「データゴミ」だ

[[433430]] Facebook が名前を Meta に変更し、Metaverse への本格的...

...

人間が作成したデータは高価すぎます!開発者はAI合成データをひそかに使用してモデルをトレーニングしている

現在、開発者は AI によって生成されたデータをひそかに使用して AI モデルをトレーニングしていま...