AWS が ML プラットフォーム SageMaker の 9 つの主要なアップデートを発表

AWS が ML プラットフォーム SageMaker の 9 つの主要なアップデートを発表

【51CTO.com クイック翻訳】

Amazon Web Services (AWS) は、クラウドベースの機械学習プラットフォーム SageMaker の 9 つの主要な新しいアップデートを発表しました。

SageMaker は、ほぼあらゆるユースケースで ML モデルを構築、トレーニング、デプロイするために使用できる機械学習サービスを提供することを目的としています。

今年の re:Invent カンファレンスで、AWS は SageMaker の機能をさらに進化させるためのいくつかの発表を行いました。

AWS の Amazon Machine Learning 担当副社長である Swami Sivasubramanian 氏は次のように述べています。

「何千人もの開発者やデータサイエンティストが、すでに業界をリードする機械学習サービスであるAmazon SageMakerを使用して、カスタム機械学習モデルの構築、トレーニング、展開の障壁を取り除いています。SageMakerのような広く採用されているサービスがあれば、

このプロジェクトの最も優れた点の 1 つは、次の成果物の開発を推進するクライアントからの提案が多数得られることです。

本日、Amazon SageMaker 向けのツールセットを発表しました。これにより、開発者はエンドツーエンドの機械学習パイプラインを簡単に構築でき、カスタム機械学習モデルを準備、構築、トレーニング、説明、検査、監視、デバッグ、実行し、より優れたパフォーマンスを実現できます。

大規模な可視性、説明可能性、自動化。 ”

最初の発表は、機械学習用にデータを自動的に準備するように設計された機能である Data Wrangler です。

Data Wrangler を使用すると、顧客はさまざまなデータ ストアから必要なデータを選択し、ワンクリックでインポートできます。 300 を超える組み込みデータ コンバーターが含まれており、コードを記述せずに関数を標準化、変換、結合できます。

デロイトの AI エコシステムおよびプラットフォーム リーダーシップの責任者であるフランク ファラル氏は、次のようにコメントしています。

「SageMaker Data Wrangler は、新製品を市場に投入するために必要な機械学習データ準備プロセスを加速する豊富な変換ツールセットを備えており、データ準備のニーズに先駆けて対応できます。

その結果、当社のクライアントは、当社が迅速に展開を拡大できることから恩恵を受け、数か月ではなく数日でクライアントのニーズに応えて測定可能で持続可能な結果を​​提供できるようになります。 ”

2 番目の発表は、Feature Store です。 Amazon SageMaker Feature Store は、トレーニングと推論のための機械学習機能を簡単に保存、更新、取得、共有できる新しいリポジトリを提供します。

Feature Store は、複数のモデルにマップされる機能を保存するという問題を克服するために設計されています。専用の関数ライブラリにより、開発者は関数にアクセスして共有することができ、開発者チームとデータ サイエンティスト間で関数セットの命名、整理、検索、共有が容易になります。それは

AWS は、ML モデルが実行される場所に近い SageMaker Studio で、1 桁ミリ秒の推論レイテンシを実現していると主張しています。

Intuit のデータ プラットフォーム エンジニアリング担当副社長 Mammad Zadeh 氏は次のように述べています。

「Amazon SageMaker Feature Store を立ち上げる前に AWS と緊密に連携してきましたが、完全に管理された機能ストアの実現により、組織内で複数の機能リポジトリを維持する必要がなくなることを非常に嬉しく思っています。

当社のデータ サイエンティストは、中央ストア内の既存の関数を使用し、チームやモデル間で関数の標準化と再利用を推進できるようになります。 ”

次に、機械学習専用に構築された、使いやすい継続的インテグレーションおよび継続的デリバリー (CI/CD) サービスとして初めて登場した SageMaker Pipelines があります。

開発者は、データの読み込み手順、Amazon SageMaker Data Wrangler を使用した変換、Amazon SageMaker Feature Store に保存される機能、トレーニング構成、アルゴリズム設定など、エンドツーエンドの機械学習ワークフローの各ステップを定義できます。

デバッグ手順と最適化手順。 。

進行中の出来事を考慮すると、SageMaker Clarify は今週の AWS の最も重要な機能の 1 つになる可能性があります。

Clarify は、機械学習ワークフロー全体にわたってバイアス検出を提供し、開発者が ML モデルに高い公平性と透明性を組み込めるようにすることを目的としています。開発者は統合ソリューションを使用して、モデル内の逸脱に迅速に対応することができます。

通常は時間のかかるオープンソース ツール。

DFLグループのデジタルイノベーション担当エグゼクティブバイスプレジデント、アンドレアス・ヘイデン氏は次のように述べています。

「Amazon SageMaker Clarify は、Bundesliga Match Facts デジタル プラットフォームの他の部分とシームレスに統合されており、Amazon SageMaker で機械学習ワークフローを標準化するという当社の長期戦略の重要な部分を占めています。

機械学習などの AWS の革新的なテクノロジーを使用してより深い洞察を提供し、ピッチ上での一瞬の決断をファンがよりよく理解できるようにすることで、Bundesliga Live は視聴者に重要な決断に関する深い洞察を提供します。全ての試合。 ”

Amazon SageMaker のディーププロファイリングは、システムリソースの使用率を自動的に監視し、検出されたトレーニングのボトルネックに対して必要に応じてアラートを提供します。この機能はフレームワーク(PyTorch、Apache MXNet、TensorFlow)全体で利用可能で、自動的に収集します。

トレーニング スクリプトのコードを変更せずに、システムとトレーニングのメトリックを設定します。

次に、SageMaker に分散トレーニングを実装しました。AWS によると、これにより、大規模で複雑なディープラーニング モデルを現在の方法よりも最大 2 倍速くトレーニングできるようになります。

Turbine の CTO である Kristóf Szalay 氏は次のようにコメントしています。

「私たちは機械学習を使用して、Simulated Cell と呼ばれる独自のネットワーク アーキテクチャに基づいて、コンピューターでシミュレートされた人間の細胞モデルをトレーニングします。Simulated Cell は、分子レベルでさまざまな介入を正確に予測することで、新しいがん治療薬を発見したり、既存の治療法の新しいターゲットを見つけたりするのに役立ちます。」

コンビネーションパートナー。

シミュレーション トレーニングは何度も繰り返して行いますが、各トレーニングの実行には 1 台のマシンで数日かかるため、新しいアイデアを迅速に反復する能力が妨げられます。

私たちは、Amazon SageMaker での分散トレーニングに非常に期待しています。これにより、トレーニング時間が 90% 短縮され、セルラー モデル トレーニング用のクラス最高のコードベースを作成するという私たちの主な使命に集中できるようになると期待しています。

最終的に、Amazon SageMaker により、患者のための新しいがん治療薬の特定と開発という私たちの主な使命をより効果的に遂行できるようになります。 ”

SageMaker のデータ並列エンジンは、複数の GPU 間でデータを自動的に分割することで、トレーニング ジョブを単一の GPU から数百または数千に拡張し、トレーニング時間を 40% 短縮します。

エッジコンピューティングの進歩が急速に進む中、AWS は SageMaker Edge Manager でそれに追いついています。

Edge Manager は、開発者がエッジ デバイスのフリートに展開された ML モデルを最適化、保護、監視、および保守するのに役立ちます。 Edge Manager は、ML モデルの最適化とエッジ デバイスの管理を支援するだけでなく、モデルに暗号署名し、予測データをデバイス外に保つ機能も提供します。

監視と分析のために SageMaker にアップロードし、状況を追跡して視覚的なレポートを提供するダッシュボードを表示する機能。 SageMaker コンソールにデプロイされたモデル。

Lenovo の PC およびスマートデバイス向けクラウドおよびソフトウェア担当副社長の Igor Bergman 氏は次のようにコメントしています。

「SageMaker Edge Manager は、導入後のモデルの最適化、監視、継続的な改善に必要な手作業を排除するのに役立ちます。これにより、当社のモデルは他の同様の機械学習プラットフォームよりも高速に実行され、メモリ消費量が少なくなると期待しています。」

Lenovo のサービス ポートフォリオ全体にわたって AI を新しいアプリケーションに拡張していく中で、クラウドと何百万ものエッジ デバイスの両方で柔軟かつ拡張可能な高性能パイプラインが引き続き必要になります。だから私たちはAmazonを選んだのです

SageMaker プラットフォーム。豊富なエッジツークラウドおよび CI/CD ワークフロー機能により、機械学習モデルをあらゆるデバイスのワークフローに効果的に導入し、生産性を向上させることができます。 ”

最後に、SageMaker JumpStart は、機械学習の導入経験が少ない開発者でも簡単に始められるように設計されています。

JumpStart は、開発者に、クラス最高のソリューション、アルゴリズム、サンプルノートブックを見つけるための、使いやすく検索可能なインターフェースを提供します。開発者は、不正検出、顧客離脱予測、予測など、エンドツーエンドの機械学習テンプレートから選択できます。

選択して SageMaker Studio 環境に直接デプロイします。

AWS は SageMaker の改善を続けており、過去 1 年間で 50 を超える新機能を提供してきました。大規模な新機能リリースの後では、2020 年を楽しみに待つべきではないかもしれません。

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  調査レポート:2021年の人工知能開発動向予測

>>:  将来の人工知能戦争の運用概念に関する研究

ブログ    

推薦する

AIがマーケティングオーディエンスの洞察をどのように変えるのか

[[429813]]人工知能は、企業のマーケティング範囲の拡大に大きく貢献することが証明されています...

...

ソフトウェア開発における AI と機械学習の応用: 将来の動向と課題

人工知能 (AI) と機械学習 (ML) は、現代のソフトウェア開発の重要な部分になりつつあります。...

人工知能を使って手作業を置き換え、コストを削減し、効率を高めることは、まさに賢いことだ

「大丈夫ですよ。」 15年間工場で働いてきた「古い」労働者として、今日は人工知能についての私の見解を...

量子もつれによりホログラムが生成されます。物体は画像を形成するために光を放射する必要はありません。

新たな研究によると、量子力学は科学者が物体から光を捉えることなくホログラムを生成するのに役立つ可能性...

...

Quora は機械学習をどのように活用していますか?

[[202181]] 2015年、同社のエンジニアリング担当副社長であるXavier Amatri...

Baiduカスタマイズ画像オープンプラットフォームのトレーニングと評価

背景Baiduは昨年11月にカスタマイズされた画像トレーニングサービスを開始しました(https:/...

...

...

いくつかのシンプルな負荷分散アルゴリズム

負荷分散とは負荷分散(英語名は Load Balance)とは、複数のサーバーを対称的に構成したサー...

...

2018 年最も注目された AI および機械学習のスタートアップ 10 社

PwCとCB Insightsによるマネーツリーのレポートによると、人工知能のスタートアップへの投資...

...