Google は、99% のプログラマーに勝る AutoML を Kaggle プラットフォームに統合しました。

Google は、99% のプログラマーに勝る AutoML を Kaggle プラットフォームに統合しました。

今後、Kaggle のコンペティションに参加する際には、AutoML を直接送信して、参加する AI モンスターを自動的にトレーニングできるようになります。 Google は本日、Cloud AutoML サービスを Kaggle プラットフォームに深く統合すると発表しました。有料サービスではありますが、無料トライアルと補助金プランのパッケージを提供しています。

Google は、機械学習アルゴリズムのトレーニング用 Cloud AutoML サービスを自社のデータサイエンス プラットフォーム Kaggle に統合すると発表した。

Cloud AutoML は、AI モデルをトレーニングするためのドラッグ アンド ドロップ インターフェースを提供するクラウドベースのツールキットです。 AutoML を使用すると、誰でも最小限の労力と機械学習の専門知識でカスタム機械学習モデルを作成できます。

[[281434]]

Kaggle は、データ サイエンティストやその他の機械学習愛好家が研究、分析、作業の共有を行うオンライン コミュニティです。2017 年に Google に買収されました。 Kaggle は、世界最大の機械学習およびデータサイエンスの競争プラットフォームでもあります。ちょうど本日、Google は、Kaggle コミュニティがユーザー数が 350 万人を超え、新たなマイルストーンに到達したことを発表しました。

Google は、Cloud AutoML を Kaggle と統合することで、「データ サイエンティストのコミュニティに、この分野をリードするために必要なスキルとツールを提供することで力を与える」という使命を推進していると述べている。

Cloud AutoML を使用すると、ユーザーはソフトウェア開発キットまたは Web ベースのユーザー インターフェースからデータを取得し、いくつかのパラメータを設定して、そのデータに基づいてモデルをトレーニングできます。トレーニングされたモデルは、Google のクラウド インフラストラクチャに直接デプロイできます。

この新しい統合により、Kaggle ユーザーは、データ サイエンティストがライブ コード、数式、視覚化、説明テキストを含むデータを作成および共有するために使用するオープン ソースの Web アプリケーションである Jupyter Notebooks で Cloud AutoML SDK を直接使用できるようになります。

「本日のリリースの焦点は、コミュニティが SDK を Kaggle Notebooks で直接使用できるようにすることです」と Kaggle プロダクト マネージャーの Devret Rishi 氏は述べています。

Cloud AutoML は有料サービスですが、初心者向けに無料トライアルも提供しています。 Google はまた、Kaggle での AutoML の使用コストを補助するために、年間を通じてユーザーに Google Cloud Platform (GCP) クレジットを提供しており、GCP にサインアップするすべての新しい Google アカウントには 300 ドルの補助金が支給されます。

今年 6 月、Google は BigQuery データ ウェアハウス サービスも Kaggle と統合しました。この統合により、BigQuery ユーザーは高速 SQL クエリを使用し、SQL で機械学習モデルをトレーニングし、Kaggle カーネルと呼ばれる Kaggle の Jupyter ノートブック環境で分析できるようになります。

Google によると、このアプローチの利点は、ユーザーがクエリを実行したり機械学習を実行したりするために、実際にデータを移動したりダウンロードしたりする必要がないことです。 Google Cloud アカウントをカーネル ノートブックまたはスクリプトにリンクすると、BigQuery API クライアント ライブラリを使用してノートブック内で直接クエリを作成し、BigQuery に対して実行して、データを使用してほぼすべての種類の分析を実行できるようになります。

AutoML の威力はどれほどか: Kaggle のコンテストで人間のプログラマーの 99% に勝利

AutoML が初めて注目を集めたのは、今年初め、Cloud Next ’19 の Kaggle Days で開催された機械学習のコンテストでトップ候補として浮上したものの、最後の最後でデータ サイエンティストのグループによって僅差で敗退した時でした。

今年 4 月、8.5 時間に及ぶ Kaggle Days データ処理チャレンジに非常に特別なチームが参加しました。この 3 人の Google 研究者グループは、自分たちだけで競争するつもりはなく、AutoML と呼ばれる AI ソフトウェアを使用して競争に参加しました。

残りの200人以上の参加者は、Kaggleプラットフォームのトップ層から集まり、「匿名の自動車部品メーカーからデータを入手し、それを使って工場の生産量における不良品バッチを予測する」という課題で複数のチームを結成した。

[[281435]]

Googleの研究者であるQuoc Leは同僚のMing ChenとYifeng LuとともにAutoMLプロジェクトを主導した。

会場には大会のリアルタイムランキングが映し出される大型スクリーンが掲げられており、参加プログラマーたちはこの大型スクリーンの影の下で懸命に作業に取り組んでいた。プログラマーは、テスト用のコードをウェブサイトに送信することでコンテストでの成功を測定し、スコアはリアルタイムで画面に表示されます。

Kaggle.com でトップランクの「第一人者」であるウラジミール・イグロビコフ氏は、AI がトップクラスのプログラマーに取って代わることができるかどうかについては懐疑的であり、会議に出席したほとんどの人々は、AI ソフトウェアが世界トップクラスのデータ サイエンティストの創造性に匹敵することは不可能であることに同意した。

しかし、コンテスト開始から数時間後、衝撃的な結果が明らかになりました。AutoML が初めて自動生成コードを提出し、ほとんどのグループを上回り、リーダーボードで 2 位にランクされたのです。しかし、これは Google チームにとってまったく驚くべきことではありません。彼らは 3 年前に多額の費用をかけてこのソフトウェアを開発しましたが、その本来の目的は彼ら自身の作業の一部を置き換えることでした。

Google で AutoML の開発を主導した AI 研究者の Quoc Le 氏は興奮しています。彼と彼のチームは、これまで何度か Kaggle コンテストで AutoML をテストしてきましたが、通常、数時間ではなく数か月かかります。 AutoML がライブ コンテストで上位 10% に入ることができれば成功だと考えています。

午後3時30分までに、最も近い人間チームがはるかに遅れをとっていたため、AutoMLの勝利は確実になったように見えました。午後 5 時 30 分に参加者が集まり、最終スコアを確認すると歓声が上がりました。AutoML が 2 位になったのです。

AutoML はトップクラスの人間のプログラマーの 99% に勝ちます。

さらに、コンテストでは、AutoML を使用したチームは、ドメインの専門知識や監督を必要とせずに、最小限の労力で優れたパフォーマンスを迅速に達成することができました。データの準備に費やす時間は非常に少なく、特徴エンジニアリング、モデルの選択、ハイパーパラメータの調整に費やす時間はほとんどありません。

さらに、別の IEEE コンテストでは、AutoML の時間効率の優位性がさらに顕著になり、数千のチームがリーダーボードで AutoML のベースライン レベルを大幅に上回るまでに数週間かかりました。

上の図は、コンテスト開始時に公開された AutoML Tables ベンチマーク スコア (緑の線) と比較した、コンテスト開始から最初の 4 週間の提出スコア (個々のスコア) を示しています。青い点線は、毎日の提出スコアの 90 パーセンタイル レベルを示しています。 AutoML Tables ベンチマークは、コンテストの最初の 2 週間の両方でこのレベルを超えました。

AutoML のシンプルさと有効性により、データ サイエンスの問題を抱える人 (必ずしもデータ サイエンスの深い知識を持っているわけではない人) でも強力なモデルを作成できるようになります。

大きな報酬: AutoML を使用する Kaggle ユーザーは、関連するアカウントごとに 300 ドルの補助金を受け取ります。

Cloud AutoML は、ユーザーがさまざまなタスク セット (ビジョン、言語から構造化データまで) 向けにカスタム機械学習モデルを構築するのに役立ちます。実際の使用方法はアプリケーションごとに異なりますが、すべての方法は、SDK または Web UI からデータを抽出し、ユーザーが設定を調整できるようにし、トレーニング済みのモデルを出力するという一般的なパターンに従います。今日のハイライトは、私たちのコミュニティが Kaggle Notebooks で SDK を直接使用できるようになったことです。

はじめに: Kaggle で AutoML を使用する方法

Kaggle と AutoML の統合は、BigQuery を Kaggle Notebooks に導入するという前回の取り組みに続くものです。

開始するには、GCP アカウントをリンクし、使用するクラウド サービスへのアクセスを承認するだけです。クラウド ストレージを有効にすると、AutoML がデータに簡単にアクセスできるようになります。

Google アカウントをリンクした後、クラウド アカウントの準備ができていることを再確認する必要があります。これを行うには、GCP プロジェクトで Machine Learning API と課金設定が有効になっていることを確認します。 AutoML は有料サービスです。より多くの Kaggler が AutoML を利用できるように、サービス利用コストを補助する GCP クレジットを年間を通じて提供することを計画しています。GCP に登録されたすべての新規アカウントには 300 ドルのクレジットが付与されます。

ユーザーは、Kaggle Notebook に組み込まれているクライアント SDK を使用するか、クラウド コンソールの Web インターフェースを使用して、AutoML を簡単に実行できます。 Notebook で AutoML を使用するには、ヘルプ ドキュメントまたはチュートリアルをご覧ください。自動化された機械学習のトピックと、それがデータ サイエンスのワークフローをどのように改善できるかについて詳しくは、説明ビデオをご覧ください。

現在、AutoML は Kaggle のコンペティション プラットフォームに深く統合されています。今後の Kaggle のコンペティションでは、ますます多くのプログラマーが AutoML を参加に送ってくると信じています。

<<:  ほんの数行の Python コードで、将来の子供がどのような外見になるかを予測できますか?強力な人工知能

>>:  人工知能は企業で実用化されつつある

ブログ    
ブログ    

推薦する

...

人工知能はサイバーセキュリティにとって役立つのか、それとも脅威となるのか?

企業に対するセキュリティ上の脅威は常に存在していましたが、インターネットの発展により、脅威は物理空間...

Facebook が人工知能を活用する 6 つの方法 (予想外のものもいくつかある)

[51CTO.com クイック翻訳] Facebook は人工知能を使用してポルノを識別し、マーク...

英国メディアが人工知能の軍事応用とそのリスクを分析

[[440377]]はじめに12月7日、英国のドローン戦争ウェブサイトは、人工知能が各国の軍事部門に...

AI トレーニングを容易にするために、分散を通じてクラウドで弾力的なスループットを実現するにはどうすればよいでしょうか?

翻訳者 | 李睿レビュー | Chonglou人工知能は現在、定量的研究などの分野におけるソフトウェ...

AIの最下層に突入! NUSのYou Yang氏のチームは拡散モデルを使用してニューラルネットワークパラメータを構築したとLeCun氏は称賛した。

拡散モデルは新たな大きな応用をもたらしました——ソラが動画を生成するのと同じように、ニューラルネット...

機械学習が医療に革命を起こす

その中で、ヘルスケア業界は強力なスポンサーであり、新しいテクノロジーを積極的に導入してきました。人工...

人工知能変革の転換点をどう乗り越えるか

Milvus は、オープンソースの人工知能エコシステムにデータ サービス機能を提供するオープンソース...

センスタイムは香港証券取引所に上場し、最悪の時期から脱却した。

【51CTO.comオリジナル記事】著者: 張傑本日2021年12月30日、SenseTimeの2...

IoTセキュリティにおける人工知能の重要性

[[423901]]画像ソース: https://pixabay.com/images/id-601...

2020 年のソフトウェア開発における 6 つの画期的なトレンドは何ですか?

[[313570]] 1. ブロックチェーンブロックチェーンは、間違いなく IT 業界で最も議論さ...

ZTouch、AIを活用して広告効果を高めるデジタル広告プラットフォーム「Darwin」をリリース

2021年5月20日、北京中良プロトンネットワーク情報技術有限公司傘下の企業向けデジタルサービスプラ...

機械学習が自閉症の「非コード変異」の秘密を解明

新たな研究によると、遺伝子間の自然発生的な突然変異は、生まれつきの遺伝子と同じくらい自閉症において重...

人工知能2.0の時代、機械にスマートな脳を搭載する方法

[[419760]] 「クラブアップルの木は、その赤みがかった色にもかかわらず、霧雨の中にひとりぼっ...