AutoML 2.0: データ サイエンティストは時代遅れか?

AutoML 2.0: データ サイエンティストは時代遅れか?

AutoML はここ数年で急速に成長しました。そして、景気後退が避けられない状況となった今、人工知能(AI)と機械学習で開発を自動化するというアイデアがさらに注目を集めることになりそうだ。現在業界で発売されているさまざまな新しいプラットフォーム (https://dotdata.com) には、より多くの自動化機能が備わっています。 AI はいわゆる特徴エンジニアリングを推進できるようになり、ユーザーはデータ サイエンス処理のための特徴を自動的に検出して作成できるようになりました。このアプローチは、データ サイエンスに対するまったく新しいアプローチを切り開き、データ サイエンティストの役割を脅かすものとなる可能性があります。

では、データ サイエンティストはこうした進展について懸念する必要があるのでしょうか? 自動化プロセスにおけるデータ サイエンティストの役割は何でしょうか? また、この新たな自動化を踏まえて、ビジネスはどのように進化するのでしょうか?


従来のデータサイエンスのプロセス(図;dotData)

AutoML 2.0はデータサイエンスをさらに自動化します

第 1 世代の AutoML プラットフォームは、主にデータ サイエンス プロセスの機械学習部分の自動化に重点を置いていました。しかし、従来のデータ サイエンスのワークフローで最も時間がかかり、最も難しい部分は、特徴エンジニアリングと呼ばれる部分です。特徴エンジニアリングは、主にデータ ソースを接続し、さまざまな「特徴」を含む大規模な「特徴テーブル」を構築する、非常に手作業の多いステップです。同時に、これらの要素は複数の機械学習アルゴリズムに対して評価する必要があります。

今日の特徴エンジニアリングの課題は、新しい特徴はより高度なドメイン専門知識がなければ「作り出せない」ということであり、特徴が評価、拒否、または選択されるたびにこのプロセスを反復的に実行する必要があります。しかし最近、この課題に対処するために設計された追加機能と自動化を提供する新しいプラットフォームが業界に登場しました。一部のプラットフォームには、リレーショナル データ ソースや非構造化ファイルから特徴テーブルを自動的に作成できる「自動特徴エンジニアリング」機能が搭載されています。データ サイエンス プロセス内の要素を「自動生成」するこの機能は、ゲームを変える機能です。

突然、「市民」データ サイエンティストが、ML および AI モデルを開発する組織にとって貴重な貢献者になり始めました。一般的に、「シチズン データ サイエンティスト」とは、ビジネス インテリジェンス (BI) アナリスト、データ エンジニア、および深いドメイン知識を持つ組織のその他の技術に精通したメンバーを指します。機械学習の助けを借りて、BI チームは自動化された要素エンジニアリングを使用して数日で複雑な予測分析アルゴリズムを開発できるため、データ サイエンティストを必要とせずに生産性が大幅に向上します。

自動化されたデータサイエンス:民主化

AutoML 2.0 プラットフォームの主な利点の 1 つは、データ サイエンスを真に民主化できることです。

データ サイエンスの自動化により、機能の発見と作成のプロセスを加速し、自動的に実行できるため、より広範なユーザー コミュニティがデータ サイエンス プロセスに貢献できるようになります。機能作成の自動化により、「市民」データ サイエンティストは極めて有用で、高度に最適化されたユース ケースを作成できるようになります。また、シチズン データ サイエンティストは通常​​、高度な「ドメイン専門知識」を持っているため、データ サイエンス チームからのサポートをほとんど受けずに、組織にとって価値の高いユース ケースに集中できます。

市民データ サイエンティストを育成するもう 1 つの利点は、企業がデータ サイエンティストを採用できないことを心配することなく、データ サイエンスの利用を拡大できることです。 2018 年の LinkedIn の調査によると、米国の組織ではデータ サイエンティストの採用に苦労していることがわかりました。これを踏まえると、新しいデータ サイエンスの貢献者を発見できることが特に重要です。

世界経済が大きな不確実性に直面している今、最小限の投資でいくつかの新しいカテゴリーの AI/ML 開発者を発見できることは、間違いなくゲームを変えるような価値提案となり、競争上の優位性を維持または向上させる上で大きな意義を持つでしょう。

自動化されたデータサイエンス: 生産性、代替ではない

しかし、データ サイエンティストの置き換えや代替に重点を置く AutoML 2.0 プラットフォームは、大きな間違いを犯すことになります。ほとんどのデータ サイエンティストは、特徴エンジニアリングを仕事における最大のハードルの 1 つと考えています。自動化は、自動化なしでは実現できない驚異的な生産性向上を実現し、機能エンジニアリングのプロセスをスピードアップするのに役立ちます。

データ サイエンティストにとって、AutoML 2.0 を活用すると作業が大幅にスピードアップし、作業時間を数日から数か月短縮できる場合が多くあります。さらに、AutoML 2.0 プラットフォームで AI ベースの特徴エンジニアリングを使用するデータ サイエンティストは、これまで考慮していなかった特徴を発見することもできます。 AI を活用した特徴エンジニアリングでは、特徴を自動的に構築、評価、アクティブ化し、複数の列 (多くの場合、異なるテーブルやソースにまたがる) のデータを組み合わせることができます。

さらに、AutoML 2.0 には自己発見の要素があり、データ サイエンティストは、時間やドメインの専門知識の不足によりデータ サイエンティストがこれまで考慮したことのない、いわゆる「未知の未知」を探索できます。

AutoML 2.0: より効率的で包括的な AI/ML プログラムの作成

したがって、AutoML 2.0 プラットフォームは、データ サイエンティストの生活を脅かすのではなく、データ サイエンスのプロセスを加速し、データ サイエンスを民主化するのに役立ちます。同時に、AutoML 2.0 は、データ サイエンティストの生産性を向上させるために必要な加速および自動化手段も提供し、データ サイエンティストが作業を拡大してビジネスにさらなる利益をもたらすことを可能にします。 AutoML 2.0 プラットフォームには、データ サイエンスの民主化を促進し、データ サイエンス プロセスを加速するという 2 つの利点があり、これが最も重要なセールス ポイントでもあります。この 2 つの利点は、現代の組織がデータ サイエンス プロセスを拡張するための鍵となります。

<<:  エネルギー分野における人工知能の機会と課題

>>:  飛んでくる花穂は人々を不安にさせますが、人と機械の組み合わせで不安を防ぐことができます!

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

スーパー人工知能はいつ実現されるのでしょうか?

01 近未来1997 年 5 月 3 日、IBM のチェス コンピュータ Deep Blue と世...

工業情報化部:5G、人工知能などの技術を活用し、中小企業の業務・生産再開を支援

工業情報化部は4月9日、「工業情報化部弁公室による2020年の業務・生産再開を支援するための中小企業...

炭素クレジット監査における人工知能の応用

カーボン クレジットとは、保有者に 1 トンの二酸化炭素またはその他の温室効果ガスに相当する排出権を...

世界初のグラフェン半導体がネイチャー誌に掲載され、中国チームがムーアの法則の寿命を10年延長しました!

シリコンはすべての電子機器の終焉をもたらすのか?この記録はグラフェンによって破られました!天津大学と...

CNNを知っておくべきだ

CNN というと、最初は特定のテレビ局を思い浮かべる人が多かったのですが、数年後にはディープラーニン...

DeLu Deep Vision: 3Dマシンビジョンに焦点を当て、セキュリティの「スマートアイ」を照らす

[[283588]] [51CTO.comより]先日、「勢いの刷新と知能の統合」をテーマにした世界人...

人工知能革命は雇用を創出するのか、それとも雇用を破壊するのか?

技術革命への懸念私たちは技術革命を心配すべきでしょうか、それとも期待すべきでしょうか。一方では、技術...

記憶は人工知能開発の重要な側面を示している

一般的に言えば、人間が不規則な電話番号の列を記憶するには長い時間がかかりますが、人工知能はこの情報を...

AIスタートアップの構築から得た3つの重要な教訓

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

Windows コンピューターでディープラーニング モデルをトレーニングしますか?非常に詳細な設定チュートリアルはこちら

ほとんどのディープラーニング モデルは Linux システムでトレーニングされていますが、Windo...

TOP50 人工知能のケーススタディ: AI は単なる誇大宣伝ではなく、努力によって実現される

AIは自慢するだけでなく、実践を通じて達成されます。コンセプトがどんなに優れていても、結果が重要です...

...

脳コンピューターインターフェースツール:脳波からテキストまで、必要なのは機械翻訳モデルだけ

[[320655]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

Facebookは人々の生活を一人称で分析する新しいAIシステムを開発中

Facebookは、独自のARグラスを開発するためにRay-Banと提携するなど、拡張現実技術に多大...

事前トレーニング後、パフォーマンスが悪化します。自己トレーニングは事前トレーニングに取って代わるものでしょうか?

2018年末には、FAIRの研究者らが「ImageNetの事前トレーニングの再考」と題する論文を発...