コードを入力せずに機械学習を行うことはできますか?アマゾンウェブサービスが今回大きな動きを見せた

コードを入力せずに機械学習を行うことはできますか?アマゾンウェブサービスが今回大きな動きを見せた

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

コードを書かずに機械学習を行うことはできますか? !

これは、Amazon Web Services が最近の Amazon Web Services re:Invent カンファレンスで発表した、コード不要のビジュアル機械学習のための新しいツールです。

Amazon Web Services の re:Invent カンファレンスは、クラウド コンピューティング業界の「春の祭典」とも言える、IT テクノロジー分野のベンチマーク イベントです。カンファレンスにちなんでシアトルの本社ビルの名前も変更されており、ブランドの影響力がいかに強いかがわかります。

このイベントは過去 10 年間で、Amazon Mechanical Turk、Amazon Rekognition、Amazon SageMaker など、クラウド コンピューティングや AI 業界で数え切れないほどのベンチマーク製品を生み出してきました。

今年のAmazon Web Services re:Invent 2021でも膨大な情報量があった。最も目を引いたのは、Amazon Web Servicesの機械学習プラットフォームサービスAmazon SageMakerが「大爆発」したことだ。

コードなしで機械学習モデルを開発するという「皿」だけではありません。AIテーブル全体を縦に見ると、Amazon Web Servicesの12の製品がAI産業チェーン全体をカバーしています。

横に見ると、個人の開発者向けに用意されたエントリーレベルの無料コンピューティングパワープールから、大企業のプロフェッショナルが求める AI モデル最適化ツールまで、対応するリリースも充実しています。中国では AI 市場が急速に発展していることを考慮して、Amazon Web Services は Bilibili で中国語字幕付きの会議の記録も提供しています。

CEO はライブスピーチの中で、「Amazon Web Services は、最も幅広く、最も完全なフルスタックの機械学習サービスを提供します」と特に強調しました。

一緒にハイライトを確認し、Amazon Web Services の AI 製品のコンテキストを包括的に理解しましょう。

[[440320]]

コードなしの機械学習

まずは冒頭で触れたノーコード機械学習予測サービスが、コードを知らない人でも本当に使えるものなのか調べてみましょう。

公式紹介によると、この製品はAmazon SageMaker Canvasと呼ばれ、機械学習の経験がまったくない人を対象としています。その中にはビジネスアナリストもいるでしょうし、人事、財務、マーケティングの分野で働く人もいるでしょう。

上記のグループのほとんどは機械学習の経験がなく、コードの知識さえないことが予想されますが、現在の戦略を測定し、市場の動向を予測するためにデータを使用する必要があることは間違いありません。

Amazon SageMaker Canvas は、ビジネス上の問題を解決するために、機械学習モデルの多くのステップをインタラクティブな UI に視覚化します。コードを 1 行も書かずに、機械学習予測モデルをすばやく生成できると主張しています。

その有効性を証明するために、Amazon Web Services の AI/ML 部門が自らケーススタディを共有しました。

その中で、部門の製品マーケティングマネージャーは、Amazon SageMaker Canvas を使用して現在のマーケティング活動を評価し、その影響力と効果が十分かどうかを判断したいと考えています。

Amazon SageMaker Canvas を開いてデータをアップロードするだけです。このプロセス中に、プラットフォームは、欠落した値の入力や重複した行や列の削除など、アップロードされたデータのエラーを自動的に修正することもできます。予想通り、そのテクノロジーも独自の AI/ML から生まれています。

次に、モデル予測のターゲットを指定し、「クイック生成」をクリックして必要なモデルをトレーニングします。

結果から判断すると、プレゼンテーション効果は確かに視覚的なチャートであり、モデルの精度は 93% です。

モデルが生成された後、データ サイエンティストなどのパートナーと共有して、ビジネス担当者がこれらのモデルをさらに確認したり最適化したりできるようにすることもできます。

この公式ケースを読んだ後、視覚化インターフェースは確かに非常に優れていることがわかりました。

では、パートナーエクスペリエンスはどうでしょうか?

現在、BMW グループは、実際のビジネスプロセスにおける 600 以上のアプリケーションに Amazon Web Services の AI/ML テクノロジーを適用しており、生産ラインから販売まで、さまざまなシナリオをカバーしています。さらに、BMW には 1,500 万台のコネクテッドカーが関与しており、毎日生成される数百万キロメートルのデータはすべて Amazon SageMaker Canvas によって分析および予測されています。

シーメンス・エナジーも、この取り組みに真っ先に着手した企業の1つだ。彼らは、Amazon SageMaker Canvas を自社の機械学習ツールキットの補足として使用しています。アプリケーション部門のデータサイエンス グループのリーダーは次のように述べています。「Canvas を使用すると、データサイエンス チームと共有して共同作業できるため、より多くの機械学習モデルを作成し、モデルが品質基準と仕様を満たすことを保証できます。」

Canvas を体験している無名の大企業も数多くあります。たとえば、世界最大の民間企業である Koch Group の子会社である INVISTA も、Amazon SageMaker Canvas を使用して、ビジネスプロセスにおけるデータサイエンスの問題の処理を支援しています。

複数のレビューと直感的な表示結果を読んだ後、Amazon SageMaker Canvas は確かに期待する価値があると大まかに判断できます。結局のところ、グラフィカル インターフェースはコードよりも生産性を解放し、価値を生み出すという法則は、過去に繰り返し証明されてきました。

無料のオンライン AI ラボ

前述のように、Amazon Web Services は毎年恒例の大々的なカンファレンスで、最も幅広く、最も完全なフルスタック機械学習サービスを提供するという大胆な声明を発表しました。「最も幅広く、最も完全」であるため、 Amazon SageMaker Canvasのリリースだけでは十分ではありません。

膨大な数の研究機関や AI 愛好家のために、最先端技術の大手企業も自らのスローガンを貫く必要がある。

3 つの言葉でまとめると、「しきい値を下げる」ということです。

最も直感的なのは、コンピューティング リソースを提供することです。

近年、ハードウェアの価格の高さやソフトウェアの構成の複雑さが、初心者がAIを始める際の障壁となっており、業界の発展を制限し、より多くの人がAIに親しむことを妨げる大きな障害にもなっています。

Amazon Web Services は、摘み取ることのできる「ウール」を大量に提供するAmazon Sagemaker Studio Lab機能をリリースしました。追加の環境設定やアカウント登録を必要とせず、メールで直接ログインできるオンラインラボです。

この環境では、プロジェクトを作成する人は誰でも、12 時間の CPU コンピューティング時間、4 時間の GPU コンピューティング時間、および 15 GB のストレージ スペースを直接利用できます。

業界全体を見てみると、確かにこの構成が整っています。

Pandas または XGBoost を使用して従来の ML アルゴリズムのトレーニング用にデータを前処理する場合、基本的に 12 時間の CPU 時間で十分であることを知っておく必要があります。ディープラーニングのトレーニングでは、GPU バックエンドを選択して 4 時間の計算時間を確保することもできます。これは、小規模なデータセットでのモデルのトレーニングや微調整には十分です。

つまり、初心者の AI モデルの場合、上記のリソースを使用すると基本的に無料でトレーニングできます。

同時に、最も人気のある機械学習ツール、フレームワーク、ライブラリも事前にパッケージ化され、登録者に提供されます。Conda 環境をカスタマイズし、オープンソースの JupyterLab および Jupyter Server 拡張機能をインストールできます。上記の実験環境は GitHub と緊密に統合されているため、作成したプロジェクトは簡単にコピーして保存できます。

無料の「オンライン ラボ」とコンピューティング リソースに加えて、「ウール」のもう 1 つの部分はより直感的です - 奨学金です。

今回、アマゾン ウェブ サービスは総額 1,000 万ドルを投資して、16 歳以上の高校生や大学生が機械学習関連のキャリアへの道を切り開くのを支援することを目的としたアマゾン ウェブ サービス AI&ML 奨学金プログラムを立ち上げました。

さらに、Amazon Web Services の 1:18 スケールの自動運転レーシングカー Amazon DeepRacer も自動運転と機械学習の愛好家を対象としており、機械学習を始めて独自の強化学習モデルをトレーニングするための、より興味深く、より敷居の低い方法を提供します。

Amazon DeepRacer は強化学習によって駆動され、クラウド上の 3D レーシング シミュレーターにアルゴリズムを展開できます。また、実際の車を通じて現実世界でのレースの興奮を体験することもできます。

もちろん、成績優秀な者も奨学金プログラムに直接入学できます。

[[440324]]

Amazon Web Services は変化をもたらしているだけでなく、Intel および Udacity と提携して、経済的に恵まれない、障害を持つ、または社会的に不利な立場にある 16 歳以上の人々に 2,500 件の奨学金を授与する共同キャンペーンを開始しました。

経済的支援に加えて、これらの恵まれないグループは、最大 1 年間、Udacity のメンター、Amazon Web Services、および Intel の技術専門家から指導と支援を受けることもできます。

機械学習の「産業化」の再形成

ゼロコード機械学習のリリースであれ、より幅広い層への普及であれ、その背後には依然としてテクノロジーが支えとなっています。結局のところ、機能開発にはシナリオの深い理解と技術の蓄積が必要であり、「ユニバーサル」という言葉はテクノロジー企業のコスト削減レベルを試すものでもあります。

上記の 2 つと比較すると、Amazon Web Services が re:Invent2021 でプロの実践者向けにリリースした Amazon SageMaker の新機能は、Amazon Web Services の技術レベルをより直感的に示しており、そこからテクノロジー大手の AI/ML の将来に対する計画を見ることができます。

大多数の ML 担当者にとって、完全な機械学習プロセスには、データの準備、データのラベル付け、トレーニング、推論、および展開が含まれます。最終的なモデル推論効果は、開発者の個人レベルだけでなく、アーキテクチャ、計算能力、データなどの外部要因にも依存します。

Amazon Web Services がこれを実行するのは、個々の能力の影響を軽減するためです。同社の言葉を借りれば、AI/ML を手動のワークショップから産業化へと移行させたいと考えているのです。

具体的には、問題を 1 つのパッケージで解決するために、Amazon SageMaker は機械学習のプロセス全体をカバーする一連の複合パンチを提供します。

データ準備フェーズでは、データ エンジニアは現在の開発環境を離れ、実行中のモデルまたは分析の要件を満たすクラスターを手動で構成する必要があることがよくあります。

このため、Amazon SageMaker Studio は Amazon EMR と統合されており、Amazon SageMaker Studio ノートブックから直接 SparkUI を使用して、Amazon ECR クラスターで実行されている Spark ジョブを監視およびデバッグできます。

データの前処理、開発、またはモデルのデプロイメントを実行するためにこの環境を離れる必要がないことを考えると、上記のアクションは間違いなく理想的な完全に統合された開発環境への一歩となります。

データ注釈段階でも労働集約性がなくなり、手作業が人工知能に屈することがなくなります。

この作業には、これまでは人間による手動のラベル付けやデータラベル付けプログラムによる処理が必要でしたが、現在では、生データと要件が与えられた後、Amazon SageMaker Ground Truth Plus が機械学習による事前ラベル付けを組み合わせて、人間の専門家によるラベル付けを支援します。

この方法により、エラー率を削減できると同時に、ラベル付けのコストを 40% 削減できるため、エラーの検出効率が向上し、低品質のラベルの発生を回避できます。

トレーニング段階での改善がより重要です。

数十億のパラメータを持つ複雑なニューラル ネットワークである BERT のような古典的なディープラーニング モデルでも、GPU でのトレーニングには数千時間かかります。パラメータを最適化しても、トレーニングには数日かかります。

しかし現在、Amazon Web Services が提供する機械学習モデル最適化コンパイラである Amazon SageMaker Training Compiler を使用すると、コードをあまり追加せずに GPU インスタンスのトレーニング速度を向上させることができます。

このコンパイラの助けを借りて、BERT-base-cased、BERT-base-uncased、distilBERT-base-uncased を含む多くの古典的なディープラーニング モデルのトレーニング速度を直接50% 向上させることができます。

△ Amazon SageMaker を使用してコンパイラをトレーニングするための 2 行のコードを追加します

最後の側面は推論段階の改善です。 Amazon Web Services は、以前から有名になった「サーバーレス」の概念を提唱し、Serverless Inference と呼ばれるサーバーレス推論機能のセットを提供しました。

この機能により、データ計算量が大きく変動する状況でも、クラウドにリソースを割り当て、柔軟なリソース空間サービスを提供できます。プログラマーが基盤となるハードウェアではなく高級言語に集中できるようにすることで、専門家は専門知識に集中できるようになります。

現実には多くの顧客が特別なニーズを抱えているものの、どの程度のコンピューティングリソースが適切かを判断するのは難しいことを考慮して、Amazon SageMaker Inference Recommender という別の機能では、推論フェーズで構成と実際の動作パラメータの推奨事項を提供し、コストと速度の最適なバランスを見つけます。

上記のプロセス製品機能は、データ準備から推論段階まで、単一のポイントから組み立てられるのではなく、完全な機械学習サイクルサービスとしてリリースされます。その目的は、企業が機械学習の大規模な適用を実現し、点と点を結び付け、AI / ML産業規模の適用プロセスを開くことです。

では、このパンチの組み合わせはどれほど効果があるのでしょうか?

目に見える事例では、米国最大手のファンド運用会社であるバンガードは導入時間を96%短縮し、製薬大手のアストラゼネカは機械学習環境の導入を5分以内に完了し、金融運用会社であるナードウォレットは、当初のトレーニングニーズが増加したにもかかわらず、コストを75%削減しました。

さらに、より多様なアプリケーション シナリオからも、Amazon Web Services の AI/ML に関する徹底した調査がわかります。

たとえば、DevOps Guru for RDS を使用すると、開発者は Amazon Aurora のパフォーマンスと運用上の問題を検出し、診断し、解決することができます。

たとえば、CodeGuru Reviewer を使用すると、ソース コード内のパスワード、API キー、SSH キー、アクセス トークンを識別し、コード レビューの効率を向上させ、従来のソフトウェア業界のパフォーマンス向上に役立ちます。

興味深いことに、Amazon Web Services re:Invent 2021 カンファレンス中に、CTO の Werner Vogels 氏も忙しいスケジュールの合間を縫ってブログを公開し、この技術者が AI/ML 業界に抱く高い期待を明らかにしました。

ソフトウェア開発は、労働集約型から AI を活用したソフトウェア開発へと移行し、主導権を握るようになります。

最後に、ハードウェアの面では、Amazon Web Services も独自のチップをリリースし、一度に 3 つのモデルを発売しました。

その中で、CPUチップGraviton3は機械学習を主な機能として採用しています。

また、Trn1 インスタンスをサポートし、クラウドでのディープラーニング モデルのトレーニングに高いコスト効率と高速性を提供できるカスタマイズされた機械学習トレーニング チップ Trainium もあります。

AI/MLの産業規模のアプリケーションプロセスの開放であろうと、自社開発のハードウェアチップのリリースであろうと、よりマクロな視点から見ると、

上記の発表は、Amazon Web Services の AI/ML 事業における目に見える拡張を示しています。

Amazon Web ServicesはAIの限界を広げている

IDC のデータによると、2013 年から 2020 年にかけて、AI/ML への世界の年間支出は 0 から約 500 億米ドルに急速に拡大し、成長率は Amazon Web Services のコアビジネスであるクラウド コンピューティングのほぼ2 倍に達しました。

この傾向を見ると、Amazon Web Services が複数の攻撃を仕掛けるのは避けられないと思われます。

コード不要の機械学習やサーバーレス アプリケーションから、詳細な AI/ML、基盤となるコンピューティング能力の継続的なアップグレード、さらには多くの包括的なプランまで、これらの素晴らしいリリースはすべて、Amazon Web Services が機械学習の境界を再定義していることを示しています。

上記の発表はまだ実行されておらず、それが示す価値は当面一般の目には見えないかもしれないが、別の視点から見ると、長期的な価値の追求とインフラレイアウトの重視は、Amazon のクラウド テクノロジーの DNA に明確に刻み込まれているのではないだろうか。

1997 年にベゾスが有名な「株主への手紙」を発表したことを思い出してください。

当時は、第一世代のインターネットバブルが蓄積されつつあり、「一攫千金」は多くの人にとってまだ新しい概念でした。当時のアマゾンは、顧客、売上、ブランドの成長はすべて長期的な価値に役立つと提唱しました。また、長期的な価値のために、ベゾスは「システムやその他のインフラ」への継続的な投資を強調しました。

それ以来、Amazon Web Services は独立して運営され、クラウド コンピューティングは「概念」から実際の産業へと変化しました。Amazon Redshift と Amazon Lambda は、クラウドネイティブのデータ ウェアハウスとサーバーレス ルートの開発ももたらしました...

すべてはずっと昔に書かれたようです。

Amazon Web Services が同じ考え方で AI/ML 分野に賭け続けるのは驚くことではありません。

これはテクノロジー界の巨人としての責任であるだけでなく、今年の Amazon Web Services re:Invent 2021 のスローガン「先導し、未来を作り変える」を反映した、期待すべきことでもあります。

AI/ML分野は、より幅広い人々をカバーし、業界のシナリオを拡大し、その技術も深く探求されていることがすでにわかります。このプロセスは、業界の技術の先駆者によって継続的に推進されています。

将来、AI/MLの領域はどれくらい大きくなるのでしょうか? Amazon Web Services は徐々に新たな輪郭を定義しつつあります。

<<:  女神の若々しい姿が全開!テンセントのAIモデルGFPGANがGitHubのホットリストで1位に

>>:  自動化戦略の6つの重要な要素

ブログ    
ブログ    
ブログ    

推薦する

フェデレーテッドラーニング - プライバシーの障壁を突破し、データの価値を引き出す

1. フェデレーテッドラーニングの背景従来の機械学習手法では、トレーニングのためにデータを単一のマシ...

PHP 5 におけるガベージコレクションアルゴリズムの進化についての簡単な説明

PHP はマネージド言語です。PHP プログラミングでは、プログラマーがメモリ リソースの割り当てと...

垂直型AIスタートアップと水平型AIスタートアップ: 異なる製品ルートの選択

AIスタートアップは主に2つのスタイルに分けられます。本日の記事では、その両方を分析して見ていきます...

ディープニューラルネットワークを使用してNER固有表現抽出の問題を解決する

この記事は次のように構成されています。固有表現抽出 (NER) とはどのように識別しますか? cs2...

...

Amazon Transcribe について

Amazon Transcribe は、開発者がアプリケーションに音声テキスト変換機能を簡単に追加で...

コレクション | データアナリストがよく使用する機械学習アルゴリズム 10 個!

機械学習の分野では、「世の中にただ飯はない」という格言があります。簡単に言えば、あらゆる問題に対して...

AI研究も印象派から学べるのでしょうか?これらの生きているような人物は3Dモデルであることが判明した

19 世紀には、絵画、彫刻、版画などの分野で印象派の芸術運動が広まりました。その特徴は「形をほとんど...

わが国には「人工知能」関連企業が43万社以上あり、2021年上半期には前年比150.8%増加した。

IT Homeは7月5日、統計によると、現在わが国には43万9000社の「人工知能」関連企業がある...

エッジAIはテクノロジー業界に大きな変化をもたらしている

近年、人工知能 (AI) の出現により、私たちの産業や個人の生活は真に革命的な変化を遂げ、これまでに...

一般的なスマートカーの7つの技術についてお話ししましょう

ハイテク業界は常に進化しており、毎週新たな革命的な変化が起こっています。当然のことながら、関連するニ...

2019年、人工知能業界は再び冬を迎えたのでしょうか?ここで3つの話をしたいと思います。

ストーリー1:「予測モデル」から「データ可視化」、回帰?私たちのチームは、データサイエンスコンサルテ...

C/C++アルゴリズム設計における任意のビット幅の使用

固定小数点アルゴリズムを開発する場合、設計機能、数値的に正確なモデリング、検証 (シミュレーション)...

ChatGPT に複数のバージョンのコンテンツを入力して一度に選択できるようにする方法

人工知能が進歩するにつれて、AI ツールに対する需要も高まっています。特に GPT のような高度なツ...

DeepGlint: 顔認識の最新の進歩と産業グレードの大規模な顔認識の実践に関する議論

[[380229]] 1. 顔認識の背景紹介簡単に言えば、顔認識の問題は、2 つの顔が与えられたとき...