コンテナ内の AI と機械学習のワークロード: 知っておくべき 6 つのこと

コンテナ内の AI と機械学習のワークロード: 知っておくべき 6 つのこと

[[414746]]

企業はコンテナ内で人工知能や機械学習のワークロードを実行する準備ができているでしょうか? 専門家によると、導入する前にいくつか基本的な質問をする必要があるそうです。

人工知能/機械学習とコンテナは、今日の 2 つの主要な IT トレンドであり、多くの企業にとって大きな話題となっています。企業が AI と機械学習のワークロードをより適切に管理する方法を模索する中で、商用テクノロジーとオープンソース テクノロジーの増加により、それらの連携がますます進んでいます。

「IT リーダーにとって朗報なのは、コンテナ内で大規模な機械学習を実行するためのツールとプロセスがここ数年で劇的に改善されたことです」と ISG のエンタープライズ テクノロジー アナリスト、ブレア ハンリー フランク氏は述べています。「現在、データ サイエンティストや IT チームがこれらのシステムを使い始めるのに役立つオープン ソース ツール、商用製品、チュートリアルが数多くあります。」

コンテナ内での AI/ML ワークロードの実行: 6 つの重要な事実

IT リーダーとそのチームが AI/ML ワークロードのコンテナ化の基本的な技術的側面を詳しく調べ始める前に、考慮すべき原則がいくつかあります。考慮すべき 6 つの重要なポイントは次のとおりです。

1. AI/MLワークロードはワークフローを表す

Red Hat の CTO である Gordon Haff 氏は、他の多くのワークロード タイプと同様に、AI/ML ワークロードはワークフローとして説明できると述べています。ワークフローの観点から考えると、コンテナ内で AI/ML を実行することに関する基本的な概念が明確になります。

AI/ML では、ワークフローはデータの収集と準備から始める必要があります。 「データの収集、クリーニング、処理が完了したら、モデルをトレーニングし、トレーニング データに基づいてパラメータを調整します」とハフ氏は言います。「モデルのトレーニングが完了したら、ワークフローの次のステップは、それを本番環境にデプロイすることです。最後に、データ サイエンティストは、予測とパフォーマンス メトリックを追跡しながら、本番環境でのモデルのパフォーマンスを監視する必要があります。」

Haff 氏は、人、プロセス、環境の面で関与する可能性のある作業量を過小評価することなく、このワークフローについて説明します。コンテナ化により、一貫性と再現性が向上し、この作業が簡素化されます。

「従来、このワークフローでは、異なる環境を使用する異なる人々への 2 回または 3 回のハンドオフが必要になる場合があります」と Haff 氏は言います。「ただし、コンテナ プラットフォームに基づくワークフローではセルフサービスが可能になり、データ サイエンティストがモデルの開発とアプリケーションへの統合の責任を負うことが増えています。」

2. 他のコンテナ化されたワークロードと同様の利点

Autify の AI および ML 責任者である Nauman Mustafa 氏は、AI/ML ワークフローのコンテキストにおいてコンテナ化には次の 3 つの利点があると考えています。

  • モジュール性: モデルのトレーニングやデプロイメントなど、ワークフローの重要な部分のモジュール化を可能にします。これは、コンテナ化によって、より広範なソフトウェア開発の世界で、よりモジュール化されたアーキテクチャ、つまりマイクロサービスが可能になった方法に似ています。
  • スピード: コンテナ化により、開発/展開およびリリース サイクルが高速化されます。
  • 人材管理: コンテナ化により、チーム間の依存関係が軽減され、チームの管理も容易になります。 IT の他の分野と同様に、コンテナ化は、作業が 1 つの機能グループから別の機能グループに移るときに、「引き継いで忘れる」可能性を減らすのに役立ちます。

機械学習モデルには他のアプリケーションやサービスとは異なる技術要件や考慮事項があるかもしれませんが、コンテナ化の潜在的な利点は非常に似ています。

Red Hat のデータ サイエンティストである Audrey Reznik 氏は、AI/機械学習のワークロードまたはソリューション (ハイブリッド クラウドなど) の移植性と拡張性の向上を例として挙げました。 「コンテナはベアメタルや VM システムよりもシステム リソースの使用量が少ないため、導入のスピードアップに役立ちます」と Reznik 氏は言います。「私は『コーディングの速さが勝負』という言葉をよく使います。コーディングが終われば、コンテナを使ってソリューションを導入できるからです。」

3. チームの連携が必要

ワークフローをよりモジュール化したからといって、チームメンバー全員が協力して作業する必要がなくなるわけではありません。

「コンテナ化された環境で機械学習ワークロードの構築と運用に携わるチームメンバーが協力して作業していることを確認してください」と ISG の Frank 氏は言います。「たとえば、運用エンジニアは Kubernetes の実行には慣れているかもしれませんが、データ サイエンス ワークロードの具体的なニーズを理解していない可能性があります。一方、データ サイエンティストは機械学習モデルの構築と展開のプロセスには慣れていますが、それらをコンテナに移行したり、実行を継続したりするのに支援が必要になる場合があります。」

コンテナ化により一貫性とコラボレーションが向上しますが、このメリットを当然のことと思わないでください。

「結果の再現性が極めて重要な世界では、企業はコンテナを使用して AI/ML テクノロジへのアクセスを民主化し、データ サイエンティストが最新の IT および情報セキュリティ標準に準拠しながら実験を簡単に共有および複製できるようにすることができます」と、Red Hat のソフトウェア エンジニアリング担当グローバル ディレクターの Sherard Griffin 氏は述べています。

4. 焦点は実際には変わっていない

コンテナ化の利点の多くは AI/ML でも他のワークロード タイプとほぼ同じですが、運用上の重点領域も同様です。他のコンテナ化されたアプリケーションと同様に、注意すべき運用要件の例を 3 つ示します。

  • リソースの割り当て: ムスタファ氏は、長期にわたってコストとパフォーマンスを最適化するには、適切なリソースの割り当てが依然として重要であると指摘しました。リソースを過剰に割り当てると、時間の経過とともにお金が無駄になり、リソースの割り当てが不足すると、パフォーマンスの問題が発生します。
  • 可観測性: 問題が見えないからといって、それが存在しないということではありません。 「マルチコンテナ アプリケーションの動作を理解するには、必要な可観測性ソフトウェアを導入しておく必要があります」とフランク氏は言います。
  • セキュリティ: 「セキュリティの観点から見ると、AI/ML ソリューションの起動は、コンテナ内の他のソリューションの起動と何ら変わりありません」と、Positive Technologies の機械学習エンジニアである Alexandra Murzina 氏は述べています。つまり、最小権限の原則 (ユーザーとコンテナ自体の両方に) を適用する、信頼できる検証済みのコンテナ イメージのみを使用する、ランタイム脆弱性スキャン、その他のセキュリティ レイヤーなどの戦略が、常に最優先事項である必要があるということです。

5. コンテナはすべての潜在的な問題を解決するわけではない

自動化では欠陥のあるプロセスは改善されないのと同様に (欠陥のあるプロセスをより速く、より頻繁に実行することに役立つだけです)、コンテナ化では AI/ML ワークロードの根本的な問題は解決されません。

たとえば、機械学習モデルにバイアスが組み込まれている場合、そのモデルをコンテナで実行しても、この潜在的に深刻な問題の解決には役立ちません。

コンテナ化には大きな利点があります。これらの利点に惑わされて、コンテナ化がすべての問題の解決策であると考えるべきではありません。これは単にデータの誤りや偏見の問題ではありません。コンテナはワークフローのさまざまな側面を高速化できますが、実際にすべての作業を実行するわけではありません。

キャップジェミニのエンジニアリングおよびテクノロジー担当ディレクター、ラグー・キショア・ヴェンパティ氏は次のように述べています。 「コンテナは、AI/ML ワークロードを実行するのに非常に有益です。しかし、AI/ML ワークロードを単にコンテナ化しても、モデルの効率は上がりません。モデルのトレーニングと推論に関連する生産性を向上させる方法を提供するだけです。」

6. 構築と購入を賢く選択する

ほとんどのテクノロジーの選択と同様に、「すべきか、すべきでないか」という疑問がありますが、これは AI/ML ワークロードのコンテナ化に関する決定を下す場合にも当てはまります。ほとんどの重要なテクノロジーの選択と同様に、選択にはコストがかかります。

「機械学習ワークフローのコンテナ化には、小規模チームにとっては負担が大きすぎるコストがかかる可能性がありますが、大規模チームにとってはメリットがコストを上回ります」と、Autifly の Mustafa 氏は述べています。

IT リーダーとそのチームは、明確な目的や理由を持って、単にできるからという理由でこれを行う必要があります。

「すでに複雑な状況をさらに複雑にしないでください」と ISG のフランク氏は言います。「コンテナ化された機械学習ワークロードが、知的活動を超えたビジネス価値を提供することを確認してください。」

商用またはオープンソースのルートを選択する場合は、AI/ML を取り巻くエコシステムが急速に進化しており、独自の戦略も変化する可能性があるため、将来の柔軟性を確保する必要があります。

「企業はビジネスを 1 つのベンダーに頼るべきではありません」と Reznik 氏はアドバイスします。「ベンダーが提供するソリューションだけでなく、さまざまなオープン ソース ソリューションを使用する必要があります。さまざまなオープン ソース ソリューションは、企業のチームにさらなるイノベーションの可能性をもたらします。」

<<:  IEEE | わずか1秒でドローンは地上で宙返りできる

>>:  AI はコードの内容に基づいて関数名を自動的に生成するため、標準的な方法で名前を付けない同僚について心配する必要がなくなります。

ブログ    
ブログ    
ブログ    

推薦する

プロセス制御に人工知能をうまく導入する方法

製造業は、生産、意思決定、運用効率などのアプリケーションに人工知能 (AI) が導入されることで、大...

...

...

AIは製造業にどのように役立つのでしょうか?

AI を活用して製造効率を向上させ、インテリジェントな自動化で業界を変革します。製造業は人工知能技...

経済学における機械学習:この2つの組み合わせは明るい未来をもたらすだろう

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

Python ベースのパーセプトロン分類アルゴリズムの実践

パーセプトロンは、バイナリ分類タスク用の線形機械学習アルゴリズムです。これは、人工ニューラル ネット...

英国最高裁:AIは「発明者」として記載できない

英国最高裁判所は12月21日、特許出願において人工知能(AI)を発明者として記載することはできないと...

2021年、AIは小売業者が失われた顧客ロイヤルティを「救う」のに役立つだろう

2020 年は混乱と混乱が共存しましたが、騒動は落ち着き、小売業者は新年に再編成し、新たな常態に向か...

大規模言語モデル (LLM) の脆弱性トップ 10

人工知能 (AI) の分野では、特に OpenAI が ChatGPT や GPT-4 などの画期的...

2021 年に企業に影響を与える自然言語処理のトレンド

[[384737]] [51CTO.com クイック翻訳] 昨今、自然言語技術は企業でますます活用さ...

...

大学は人工知能人材育成に力を入れており、「ロボット工学」専攻が人気に

[[225297]]毎年恒例の「大学入試シーズン」が到来し、受験生や保護者にとって、受験願書の記入は...

ヘルスケア市場における人工知能は2028年までに615億9000万ドルに達すると予想

[[432745]]パーソナライズ医療の需要の高まりは、ヘルスケア市場における人工知能の成長を推進す...

誰も教えてくれないAI大規模導入の効率的なプロセス!

現在、AIに関するチュートリアルは数多くあります。オブジェクト検出、画像分類、NLP の実行方法、チ...