Google は、99% のプログラマーに勝る AutoML を Kaggle プラットフォームに統合しました。

Google は、99% のプログラマーに勝る AutoML を Kaggle プラットフォームに統合しました。

今後、Kaggle のコンペティションに参加する際には、AutoML を直接送信して、参加する AI モンスターを自動的にトレーニングできるようになります。 Google は本日、Cloud AutoML サービスを Kaggle プラットフォームに深く統合すると発表しました。有料サービスではありますが、無料トライアルと補助金プランのパッケージを提供しています。

Google は、機械学習アルゴリズムのトレーニング用 Cloud AutoML サービスを自社のデータサイエンス プラットフォーム Kaggle に統合すると発表した。

Cloud AutoML は、AI モデルをトレーニングするためのドラッグ アンド ドロップ インターフェースを提供するクラウドベースのツールキットです。 AutoML を使用すると、誰でも最小限の労力と機械学習の専門知識でカスタム機械学習モデルを作成できます。

[[281434]]

Kaggle は、データ サイエンティストやその他の機械学習愛好家が研究、分析、作業の共有を行うオンライン コミュニティです。2017 年に Google に買収されました。 Kaggle は、世界最大の機械学習およびデータサイエンスの競争プラットフォームでもあります。ちょうど本日、Google は、Kaggle コミュニティがユーザー数が 350 万人を超え、新たなマイルストーンに到達したことを発表しました。

Google は、Cloud AutoML を Kaggle と統合することで、「データ サイエンティストのコミュニティに、この分野をリードするために必要なスキルとツールを提供することで力を与える」という使命を推進していると述べている。

Cloud AutoML を使用すると、ユーザーはソフトウェア開発キットまたは Web ベースのユーザー インターフェースからデータを取得し、いくつかのパラメータを設定して、そのデータに基づいてモデルをトレーニングできます。トレーニングされたモデルは、Google のクラウド インフラストラクチャに直接デプロイできます。

この新しい統合により、Kaggle ユーザーは、データ サイエンティストがライブ コード、数式、視覚化、説明テキストを含むデータを作成および共有するために使用するオープン ソースの Web アプリケーションである Jupyter Notebooks で Cloud AutoML SDK を直接使用できるようになります。

「本日のリリースの焦点は、コミュニティが SDK を Kaggle Notebooks で直接使用できるようにすることです」と Kaggle プロダクト マネージャーの Devret Rishi 氏は述べています。

Cloud AutoML は有料サービスですが、初心者向けに無料トライアルも提供しています。 Google はまた、Kaggle での AutoML の使用コストを補助するために、年間を通じてユーザーに Google Cloud Platform (GCP) クレジットを提供しており、GCP にサインアップするすべての新しい Google アカウントには 300 ドルの補助金が支給されます。

今年 6 月、Google は BigQuery データ ウェアハウス サービスも Kaggle と統合しました。この統合により、BigQuery ユーザーは高速 SQL クエリを使用し、SQL で機械学習モデルをトレーニングし、Kaggle カーネルと呼ばれる Kaggle の Jupyter ノートブック環境で分析できるようになります。

Google によると、このアプローチの利点は、ユーザーがクエリを実行したり機械学習を実行したりするために、実際にデータを移動したりダウンロードしたりする必要がないことです。 Google Cloud アカウントをカーネル ノートブックまたはスクリプトにリンクすると、BigQuery API クライアント ライブラリを使用してノートブック内で直接クエリを作成し、BigQuery に対して実行して、データを使用してほぼすべての種類の分析を実行できるようになります。

AutoML の威力はどれほどか: Kaggle のコンテストで人間のプログラマーの 99% に勝利

AutoML が初めて注目を集めたのは、今年初め、Cloud Next ’19 の Kaggle Days で開催された機械学習のコンテストでトップ候補として浮上したものの、最後の最後でデータ サイエンティストのグループによって僅差で敗退した時でした。

今年 4 月、8.5 時間に及ぶ Kaggle Days データ処理チャレンジに非常に特別なチームが参加しました。この 3 人の Google 研究者グループは、自分たちだけで競争するつもりはなく、AutoML と呼ばれる AI ソフトウェアを使用して競争に参加しました。

残りの200人以上の参加者は、Kaggleプラットフォームのトップ層から集まり、「匿名の自動車部品メーカーからデータを入手し、それを使って工場の生産量における不良品バッチを予測する」という課題で複数のチームを結成した。

[[281435]]

Googleの研究者であるQuoc Leは同僚のMing ChenとYifeng LuとともにAutoMLプロジェクトを主導した。

会場には大会のリアルタイムランキングが映し出される大型スクリーンが掲げられており、参加プログラマーたちはこの大型スクリーンの影の下で懸命に作業に取り組んでいた。プログラマーは、テスト用のコードをウェブサイトに送信することでコンテストでの成功を測定し、スコアはリアルタイムで画面に表示されます。

Kaggle.com でトップランクの「第一人者」であるウラジミール・イグロビコフ氏は、AI がトップクラスのプログラマーに取って代わることができるかどうかについては懐疑的であり、会議に出席したほとんどの人々は、AI ソフトウェアが世界トップクラスのデータ サイエンティストの創造性に匹敵することは不可能であることに同意した。

しかし、コンテスト開始から数時間後、衝撃的な結果が明らかになりました。AutoML が初めて自動生成コードを提出し、ほとんどのグループを上回り、リーダーボードで 2 位にランクされたのです。しかし、これは Google チームにとってまったく驚くべきことではありません。彼らは 3 年前に多額の費用をかけてこのソフトウェアを開発しましたが、その本来の目的は彼ら自身の作業の一部を置き換えることでした。

Google で AutoML の開発を主導した AI 研究者の Quoc Le 氏は興奮しています。彼と彼のチームは、これまで何度か Kaggle コンテストで AutoML をテストしてきましたが、通常、数時間ではなく数か月かかります。 AutoML がライブ コンテストで上位 10% に入ることができれば成功だと考えています。

午後3時30分までに、最も近い人間チームがはるかに遅れをとっていたため、AutoMLの勝利は確実になったように見えました。午後 5 時 30 分に参加者が集まり、最終スコアを確認すると歓声が上がりました。AutoML が 2 位になったのです。

AutoML はトップクラスの人間のプログラマーの 99% に勝ちます。

さらに、コンテストでは、AutoML を使用したチームは、ドメインの専門知識や監督を必要とせずに、最小限の労力で優れたパフォーマンスを迅速に達成することができました。データの準備に費やす時間は非常に少なく、特徴エンジニアリング、モデルの選択、ハイパーパラメータの調整に費やす時間はほとんどありません。

さらに、別の IEEE コンテストでは、AutoML の時間効率の優位性がさらに顕著になり、数千のチームがリーダーボードで AutoML のベースライン レベルを大幅に上回るまでに数週間かかりました。

上の図は、コンテスト開始時に公開された AutoML Tables ベンチマーク スコア (緑の線) と比較した、コンテスト開始から最初の 4 週間の提出スコア (個々のスコア) を示しています。青い点線は、毎日の提出スコアの 90 パーセンタイル レベルを示しています。 AutoML Tables ベンチマークは、コンテストの最初の 2 週間の両方でこのレベルを超えました。

AutoML のシンプルさと有効性により、データ サイエンスの問題を抱える人 (必ずしもデータ サイエンスの深い知識を持っているわけではない人) でも強力なモデルを作成できるようになります。

大きな報酬: AutoML を使用する Kaggle ユーザーは、関連するアカウントごとに 300 ドルの補助金を受け取ります。

Cloud AutoML は、ユーザーがさまざまなタスク セット (ビジョン、言語から構造化データまで) 向けにカスタム機械学習モデルを構築するのに役立ちます。実際の使用方法はアプリケーションごとに異なりますが、すべての方法は、SDK または Web UI からデータを抽出し、ユーザーが設定を調整できるようにし、トレーニング済みのモデルを出力するという一般的なパターンに従います。今日のハイライトは、私たちのコミュニティが Kaggle Notebooks で SDK を直接使用できるようになったことです。

はじめに: Kaggle で AutoML を使用する方法

Kaggle と AutoML の統合は、BigQuery を Kaggle Notebooks に導入するという前回の取り組みに続くものです。

開始するには、GCP アカウントをリンクし、使用するクラウド サービスへのアクセスを承認するだけです。クラウド ストレージを有効にすると、AutoML がデータに簡単にアクセスできるようになります。

Google アカウントをリンクした後、クラウド アカウントの準備ができていることを再確認する必要があります。これを行うには、GCP プロジェクトで Machine Learning API と課金設定が有効になっていることを確認します。 AutoML は有料サービスです。より多くの Kaggler が AutoML を利用できるように、サービス利用コストを補助する GCP クレジットを年間を通じて提供することを計画しています。GCP に登録されたすべての新規アカウントには 300 ドルのクレジットが付与されます。

ユーザーは、Kaggle Notebook に組み込まれているクライアント SDK を使用するか、クラウド コンソールの Web インターフェースを使用して、AutoML を簡単に実行できます。 Notebook で AutoML を使用するには、ヘルプ ドキュメントまたはチュートリアルをご覧ください。自動化された機械学習のトピックと、それがデータ サイエンスのワークフローをどのように改善できるかについて詳しくは、説明ビデオをご覧ください。

現在、AutoML は Kaggle のコンペティション プラットフォームに深く統合されています。今後の Kaggle のコンペティションでは、ますます多くのプログラマーが AutoML を参加に送ってくると信じています。

<<:  ほんの数行の Python コードで、将来の子供がどのような外見になるかを予測できますか?強力な人工知能

>>:  人工知能は企業で実用化されつつある

ブログ    

推薦する

...

...

巨大企業間の今後の AI 戦争: マイクロソフトは左に進んで 2B、グーグルは右に進んで 2C

AI時代の到来非常にドラマチックなのは、Microsoft Build 開発者会議と Google...

データによると、ChatGPTのトラフィックは8月末から増加し始めており、これは主に新学期の始まりによるものである。

9月21日、第三者機関の最新の推計によると、人工知能チャットボット「ChatGPT」のトラフィック...

アルパカ科全体よりも優れたMeta AIの新しい自己アライメント手法は、人間の注釈データをほとんど必要としません

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

自動運転のためのエンドツーエンドの計画方法の概要

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

AIの使用後、機械は人間の皮膚に匹敵する触覚を持つ丨科学サブジャーナル

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

現時点では、ディープラーニング以外の実装方法を模索する必要がある。

[51CTO.com クイック翻訳] ディープラーニングは確かに多くの印象的な成功事例をもたらしま...

AIが初めて量子レベルで物質を記述!自然:化学分野で最も価値のある技術の一つ

[[440047]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

完璧な切り抜き王ビンビン! ByteDanceのインターンが開発したAIにより、4K 60fps動画のリアルタイム切り抜きが可能に

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

機械学習モデルを .NET 環境にデプロイするにはどうすればよいでしょうか?

データ中心のエンジニアにとって、Python と R はデータセンターで最も人気のあるプログラミング...

アリババのPingtouge Xuantie CPUが重要な進歩を遂げました。RISC-V + Android 12 AIサポートを初めて実現しました。

アリババの平頭半導体は、ARMアーキテクチャの自社開発プロセッサYitian 710の商用化を実現し...

高度な数学の問題解決ツール:写真を撮ってアップロードすると答えがわかる。この中国の学生は驚くべきAIを作った

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

一つ選びますか? Python 機械学習の実践的なヒント

原題は「Some Essential Hacks and Tricks for Machine Le...