機械学習のエントリーレベルのプラットフォームの上限であり、古典的なチュートリアルを無料で練習することもできます。これは本当に比類のないものです。

機械学習のエントリーレベルのプラットフォームの上限であり、古典的なチュートリアルを無料で練習することもできます。これは本当に比類のないものです。

[[441601]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

AI界で最も人気のある人物といえば、李牧氏でしょう。

彼は以前、「Hands-On Deep Learning」を執筆しており、同分野では入門書の定番となっている。その後、彼はBilibiliでスタンフォード大学のAI講​​座を無料で開講した。彼の難解でハードコアな論文発表の動画は36万回再生され、家庭教師から研修中の学部生まで、多くの研究グループがその番組を視聴している。

このような刺激的な共有があれば、多くの人が「私の師匠の弟子だ」と誇らしげに主張するのも不思議ではありません。

そして最近、あるプラットフォームがさらにエキサイティングなことを行っていることを発見しました。

このプラットフォームは、無料のコンピューティング能力を提供するだけでなく、入門用の定番「ハンズオン ディープラーニング」もプラットフォーム上に用意しており、誰でも無料で学習して実践することができます。その名は「Amazon SageMaker Studio Lab」です。

紹介によると、このプラットフォームはJupyterLabをベースとしており、無料のGPUとCPUのコンピューティングパワー+ 15Gの永久ストレージ機能を提供し、GitHubにもリンクされており、主流の機械学習ツールコンポーネントとオープンソースリソースパッケージの使用をサポートしています。開発者は「ハンズオンディープラーニング」教材を組み合わせてモデルをトレーニングし、自分で結果を確認できます。

さらに、申し込みに必要なのはメールアドレスだけで、公式アカウントは必要なく、クレジットカード情報を入力する必要もないと主張しています。

これは本当に良いことなのでしょうか?

今日は一緒にテストしてみましょう。

「実践的なディープラーニング」の事例を本当に実践できるのか?

リンク studiolab.sagemaker.aws を通じて、Web プラットフォームにログインし、現実を探索することができます。

  • 「ハンズオンディープラーニング」はどこで見つかりますか?

インターフェースから、プラットフォームが GPU/CPU コンピューティング パワー オプションを提供しており、料金を支払うことなく直接オンにして使用できることがわかります。

右下には、『Dive into Deep Learning』(略称:D2L)という本があります。

「D2L ノートブックを開く」をクリックするだけで、次のノートブックが開きます。

プロジェクトを開くと、システムは自動的に D2L リソースを読み込み、クラウド フォルダーに保存します。

README ファイルも開きます。これには、システム環境の構成、書籍の概要、対象読者、およびディレクトリ フレームワークが含まれています。記事の最後に各章へのリンクがあり、そこから直接入ることができます。

この時点で、コースコンテンツと実践的な操作を組み合わせることで、プラットフォームを通じてディープラーニングを学習できます——

では実際の効果はどうでしょうか?

  • どこでもどんなコードでも実行して確認できます

古典的な AlexNet を例にとり、その感覚をつかんでみましょう。

プラットフォーム上では、AlexNet の開発とその基本原理の説明が提示され、モデルの定義と構築コードを実行できます。

初心者が理解しやすいように、AlexNet 内の 8 つのレイヤーの出力を観察するための単一チャネル データの例を作成することもできます。目的は、さまざまなレイヤーの役割を直感的に理解できるようにすることです。

最も重要なのは、トレーニングモデルのリンクも公開されており、実際の操作も可能になっていることです。コード部分を選択して実行するだけです。

ただし、このプロセスには長い時間がかかります。GPU オプションでトレーニングするには約 7 分かかりました。しばらくお待ちください。

△ゆっくりと描かれた曲線を見る

インターフェース全体をノートブックとして使用して、コードを追加したり、学習や思考を記録したりできることは注目に値します。

したがって、コースを完了した後でも、記事の最後にコード列を追加したり、章の最後にある演習を参照したり、プログラミングを通じて宿題を実施したりすることができます。

  • 数学的な基礎から実践的な環境設定まで、すべてがわかりやすく整理されています

上記はほんの一部です。実際、全結合層、畳み込み、プーリングなどの概念の紹介から、ResNet や DenseNet の説明まで、すべてが Amazon SageMaker Studio Lab の無料環境で紹介され、実践されており、わかりやすく整理されています。

このプラットフォームは、高度な数学や線形代数の基礎は人によって異なり、誰もが 90 点以上を獲得しているわけではないことも考慮しています。また、単変数微積分や最大尤度などの数学の基礎の紹介とコード実装も提供し、環境設定の方法も添付しており、非常に信頼性が高いようです。

上記の検証後、この Amazon SageMaker Studio Lab では、実際にマスターの「実践的なディープラーニング」を無料で完全に実践できます。

AI/ML テクノロジーを始めたい、あるいは深く習得したい人にとって、この理論 + 実践の学習方法は当然より効率的であり、実際の仕事、科学研究、さらには将来の起業への移行がよりシームレスになります。

実際、その機能はそれ以上です。

開発者向けの無料プラットフォーム

名前からわかるように、Amazon SageMaker Studio Lab の立ち上げを支えたのは Amazon Web Services という会社です。

この最先端技術の巨人は今回、無料のプラットフォームを立ち上げました。これは、「実践的なディープラーニング」を理論と実践の演習にするだけでなく、データサイエンティスト、企業の開発者、大学の教員や学生をターゲットにしたいと考えています。

誰もが無料で気軽に機械学習を始められる機会を提供します。

実際、Amazon Web Services 以前にも、業界にはすでにいくつかのオープンな機械学習プラットフォームが存在していました。

それでは、今回の Amazon SageMaker Studio Lab の注目すべき新しいハイライトは何でしょうか?

設定から始めましょう。

このプラットフォームは、15G 以上の永続ストレージ、16G のメモリ、4 つの CPU を提供し、GPU は NVIDIA Tesla T4 であり、他の主流プラットフォームよりもわずかに優れています。

NVIDIA Tesla T4 の新しいアーキテクチャを採用しているため、混合精度コンピューティングの速度指数もそれに応じて高くなります。また、無料版では SageMaker Studio と同じアーキテクチャを採用しており、エンタープライズ レベルの Buff レイヤーを追加したことに相当し、安定性がより保証されています。

このプラットフォームでは GPU 4 時間 + CPU 12 時間を宣伝していますが、実際には、時間が経過した後でもランタイムを再度起動することができ、元のファイルはそのまま残ります。

しかし、コインをマイニングしたい場合は忘れてください...

プラットフォームでは、SageMaker Studio Lab を生産活動に使用することは明示的に禁止されており、暗号通貨のマイニングを行っていることが判明したアカウントは直接ブロックされます。

構成についてお話しした後は、実際の操作について見ていきましょう。

操作性の面では、Amazon SageMaker Studio Lab は他のプラットフォームよりもシンプルで直感的です。

インターフェースは、Jupyter Notebook ファイルを作成できるだけでなく、新しいターミナル タブと Markdown 形式のファイルを直接作成することもサポートしています。

さらに、このプラットフォームには Conda および Pip リソース パッケージ マネージャーが搭載されているため、オープン ソース ソフトウェア パッケージを繰り返しインストールする必要がなく、時間と労力を節約できます。

GitHub プロジェクトをプルするためにコマンド ラインを使用する必要はなく、左側のボタンをクリックするだけです。

クローンされたプロジェクトに yml 環境設定ファイルがある場合は、プロジェクトの作成時に Conda 環境も同期的に作成されます。

このプラットフォームは Github にもリンクされています。

私たち自身の Github プロジェクトの README ドキュメントに次のコンテンツを追加します。

[![Studio Lab で開く](https://studiolab.sagemaker.aws/studiolab.svg)](https://studiolab.sagemaker.aws/import/github/org/repo/blob/master/path/to/notebook.ipynb)

参加するには、「Studio Lab で開く」ボタンをクリックします。

他のユーザーは、ワンクリックで Amazon SageMaker Studio Lab プラットフォームにアクセスできます。

もちろん、手動でアップロードまたはコピーして新しい ipynb を作成することもできます。

古典的な画像分類アルゴリズムを例に挙げてみましょう。

他のプラットフォームから ipynb ファイルをコピーした後は、変更せずに使用できます。依存関係を手動でインストールするだけで済みます。

モデルのトレーニング速度は基本的に他のプラットフォームと同じですが、場合によってはわずかに速くなることもあります。

最後に、多くの人が懸念しているデータセキュリティの問題について検討する必要があります。

機械学習を行うと、大量のプライベートな顔情報、さらには病院の患者情報など、まだ感度が落ちていない情報に遭遇することがよくあります。他人のプライバシーとデータセキュリティを保護するために、この側面にも注意する必要があります。

Amazon SageMaker Studio Lab はエンタープライズレベルのアプリケーションから派生したもので、すべてのユーザーのデータが暗号化によって保護されることを約束します。アカウントが削除されると、関連するすべてのデータもそれに応じて削除されます。プラットフォームはそれを保持しないことを約束します。

現在、多くの有名大学や企業が Amazon SageMaker Studio Lab を活用し、支持しています。

その中には、ENIAC 発祥の地であるペンシルバニア大学工学部、カリフォルニア州サンタクララ大学の財務学部、そしてハギング フェイスがあります。

中国にも多くのフォロワーがいます。

南部の985理工大学の機械学習分野の博士課程の学生は、研究グループは従来の機械学習に重点を置いているものの、検証を支援するために依然としてディープラーニングの手法が必要だと語った。

研究室のコンピュータ機器は数年前に購入されたもので、人員と研究方向の増加に伴い、特に提出前夜にはコンピュータリソースの競争が頻繁に発生します。 Amazon SageMaker Studio Lab は確かに彼らにとって魅力的です。

[[441603]]

この無料プラットフォームのさまざまな利点について説明した後、次の質問は、「どのように申し込むか」です。

ここで詳しく説明しましょう。

Amazon Web Services アカウントは必要ありません。公式リンク studiolab.sagemaker.aws/requestAccount にログインし、メールアドレスと関連情報を入力するだけです。

ただし、できるだけ早く誰もが使用できるようにするには、次のヒントに注意してください。

言語として英語を使用し、関連する組織の名前を明確に記入し、電子メールのサフィックスが組織の英語名と一致していることを確認することをお勧めします。このようなアプリケーションは、より信頼性が高く、信頼できます。

上記の条件を満たしていれば、24時間以内に招待状が届きます。メールをご確認ください。

シームレス移行の高度なバージョン

前述のとおり、Amazon SageMaker Studio Lab と Amazon SageMaker Studio のプロフェッショナル版は同じアーキテクチャを持っているため、無料の初心者版からプロフェッショナル版に移行する場合、それは間違いなく大きな問題ではありません。

プロの開発者にとって、これは確かに高度な科学研究と起業の可能性をさらに広げることになります。

具体的には、Amazon SageMaker Studio のプロフェッショナル バージョンは、開発者に最初から最後までかなり包括的な機能セットを提供します。

たとえば、大規模モデルのトレーニングに対する実稼働ニーズを満たす大規模な分散トレーニングを提供します。パーティショニング アルゴリズムを使用して、大規模なモデルとデータセットを GPU インスタンス間で自動的に分割し、並列処理を向上させてトレーニングを高速化します。

たとえば、データラベリング機能 Ground Truth Plus は、人間の専門家を活用し、機械学習を組み合わせて事前ラベリングを支援することで、ラベリングエラーを大幅に削減し、ラベリング率を向上させます。

もう 1 つの例は、機械学習のデータ準備段階を対象としており、視覚的なインターフェースを通じてデータの選択、クリーニング、探索を実行できる Amazon SageMaker Data Wrangler です。ワンクリックだけで、コードを使わずにさまざまな構造の大量のデータをすばやく標準化および変換できます。ビッグ4の一角を占めるデロイトがこの機能を導入し、従来は数ヶ月かかっていたデータ準備が数日間に短縮された。

さらに、Amazon SageMaker Studio には、アクセス制御管理、モデル監視、サーバーレス推論機能、推論構成の推奨など、フルサイクルの産業化された AI/ML サービスも含まれています。

上記の多くは、今年の Amazon Web Services re:Invent 2021 で発表された新機能であり、同社の需要に対する理解と将来を見据えたテクノロジーを示すものとなっています。

これらの機能は、研究を行う場合でも、ビジネスを立ち上げる場合でも、プロの開発者、データ サイエンティスト、研究者により多くの可能性を提供します。

さらに興味深いのは、Amazon Web Services が事業運営だけに注力しているわけではないことです。同社はまた、多くの「非営利」の包括的な活動も提供しています。

機械学習マラソン プロジェクトはこれを反映したものです。

このイベントは年に数回開催され、プラットフォームではAI自動プログラミング、防災や被害評価など、AI関連の応用分野のテスト問題を提供します。

このイベントでは、CV、NLPなどの分野での挑戦者のスキルがテストされます。期間中、プラットフォームからは関連するプラットフォームとリソースも提供されます。優勝者には最高5万ドルの賞金が贈られます。

このような、実用的なニーズを目的とし、開発者に技術をもたらす活動は数多くあり、それぞれに楽しさと社会的価値があります。

ユーザーが機械学習を始めることができる自動運転レースである Amazon DeepRacer には、数百万人のフォロワーと 14 万人の開発者が参加しています。

また、より多くの女性が機械学習を理解して始められるように支援し、テクノロジー界における男女格差をなくすために、非営利団体 Girls in Tech と協力した活動も行われています。

また、業界で大きな注目を集めているのが、新たにリリースされたAmazon SageMaker Canvansです。コーディング経験のない企業の内部アナリストやオペレーターを対象としており、機械学習技術を実際のビジネスに適用するのに役立ちます。

テクノロジー大手は影に隠れる

最後に、Amazon Web Services の SageMaker Studio Lab をどのように評価しますか?

ビジネスの観点から見ると、これらの実践は自社のエコシステムの将来的な構築に間違いなく有益であり、大手企業がその地位を維持するために必要な行動です。また、関連実務者を年収50万で募集している企業も多数あり、これも多くの開発者にとって嬉しいことだろう。

結局のところ、人工知能の不足は肉眼で明らかです。ほとんどの開発者は豊富なプログラミング経験と数学の基礎を持っています。唯一の障壁は、機械学習に不慣れであることです。これを埋めてスープを飲むだけで、何が悪いのでしょうか?

しかし、業界の観点から見ると、上記の取り組みは確かに最先端技術の導入を促進していると言えます。

しかし、ここでの原動力は、より速くすることではなく、より広くすることです。

100年前、自動車が初めて発明された当時は、機械の専門家しか自動車の所有者になれなかったため、当時の社会では、ドライバーは最先端の技術を持つ職業であったことを知っておく必要があります。

また、30 年前、PC とインターネットは少数の開発者にとって単なるおもちゃに過ぎず、Web サイトを開発するだけで人々はすぐに金持ちになり、ビルほどの高さの資産を蓄積することができたことも知っておく必要があります。

したがって、100年前の人々は、誰もが車を運転できる社会を理解できませんでした。同様に、30年前の人々は、数回クリックするだけで独自のインターネットプラットフォームを所有できるとは想像もできませんでした。

同じことが今日の機械学習にも当てはまります。テクノロジーの世界で最も先進的な専門家でさえ、AI が実装される展望のほんの一部しか垣間見ることができません。次元を繰り返し縮小することによってのみ、この技術は何千もの業界に導入され、さまざまな背景や経験を持つ人々の手にさまざまな共鳴周波数を生み出すことができます。

これは、Amazon クラウド テクノロジーの包括的なレイアウトの価値を反映しているだけでなく、Li Mu 教授などの専門家の社会的関心も反映しています。

では、AI技術は将来どれだけのエネルギーを放出できるのでしょうか?

答えは、個々の開発者とシナリオの亀裂ごとに見つけなければなりません。

<<:  これほど多くのテストを受けて高得点を獲得したにもかかわらず、大手モデルは本当に言語を理解しているのでしょうか?

>>:  人工知能の主要技術分野のレビュー

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

「幾何学的ディープラーニング」からのディープラーニングの統合

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

米軍はU2に人工知能副操縦士を装備した。世界で最も操縦が難しい航空機は将来ドローンになるかもしれない

ロシアのスプートニク通信は12月17日、米空軍が最近、U2戦闘機の副操縦士として初めて人工知能を使用...

WSLはAIトレーニングタスクとLinux GUIアプリケーションの実行をサポートします

WSL は Windows 上で GPU を使用してアプリケーションを実行することをサポートするよう...

...

スーパー人工知能とは何ですか?

進化し続けるテクノロジーの世界において、魅力的であると同時に不安も抱かせる概念の出現が、スーパー人工...

致命的な幻覚問題、GPU 代替品の開発、大規模モデルが直面するその他の 10 の課題

ChatGPT、GPT-4などのリリースにより、大規模モデル(LLM)の魅力が明らかになった一方で、...

AIGC時代のビデオ普及モデル、復旦チームらが分野初のレビューを発表

AI 生成コンテンツは、現在の人工知能分野で最もホットなトピックの 1 つとなっており、この分野の最...

...

10分で多言語チャットボットを作成する方法

[51CTO.com クイック翻訳]チャットボットは、人間との会話を自動的に行い、組織と顧客間のビジ...

...

人工知能とモノのインターネットの統合後の応用シナリオは何ですか?

AI をクラウドからエッジに移行することで、主要市場で IoT の幅広い導入を妨げてきた帯域幅とセ...

アルゴリズム、データ、機械学習機能... AI スタートアップの堀とは何でしょうか?

[[207684]]投資家が最も注目する点の一つは、起業家が独自の堀を見つけているかどうかだ。そし...

人工知能が高齢者の日常生活に影響を与えないようにする

若者はさまざまなスワイプサービスに慣れてきましたが、これは高齢者に一連のトラブルをもたらしました。医...

...