[51CTO.com クイック翻訳] 人工知能と機械学習の概念は、データサイエンスコミュニティで人気が高まっています。これらのコンセプトにより、以前は手作業を必要としていた多くのタスクを、より効率的で正確な自動化された方法に置き換えることができるようになりました。技術トレンドの変化に伴い、自動化された機械学習は時間を節約するだけでなく、手動操作を簡素化することで効率も向上すると言えます。 自動機械学習: トレーニングプロセスの自動化概念的には、機械学習は、現実世界のデータを処理して、望ましい出力を出すように機械をトレーニングすることを目的としています。言い換えれば、機械が既存のデータ(または経験)からある程度のトレーニングを取得できるようにし、完全なデータ処理の後、より正確な出力を生成できるようになります。自動機械学習 (AutoML) の概念は、明らかにプロセス全体を完全に自動化することです。 自動機械学習の成熟モデル自動化された機械学習のさまざまな実装は、対応する成熟度に基づいてさまざまなレベルに分類できます。下の図に示すように、モデルの成熟度が高ければ高いほど、自動化されたタスクのサポートが向上します。もちろん、これには、データの集中トレーニングを通じてモデルがより多くのタスクを実行し、より多くのサービスを提供できることも必要です。 1. ハイパーパラメータの最適化 データセットが送信されると、自動化された機械学習は、上記の成熟度モデルに基づいて、ランダムフォレスト、線形回帰などのさまざまな既存のモデル(通常は構造化データを使用)との一致を試みます。同時に、データに適用される各モデルの必要に応じてハイパーパラメータを最適化します。このような最適化手法には、手動検索、ランダム検索、グリッド検索などがあります。 たとえば、Auto-sklearn はハイパーパラメータの最適化にベイズモデルを使用し、望ましい結果を提供できます。ただし、この成熟レベルのモデルでは、自動化された機械学習は、クロス検証、機械学習アルゴリズムの選択、ハイパーパラメータの最適化などの限られたタスクしか実行できません。もちろん、成熟度が上がるにつれて、自動化された機械学習の機能は向上し、より良い結果が得られるようになります。 2. レベル1以上のデータ前処理 最初のレベルでは、自動化された機械学習では、ユーザーがデータの前処理手段を自分で実装する必要があります。ただし、第 2 レベルでは、より洗練されたモデルを使用することで、さまざまなデータ前処理タスクを自動化自体で完了し、さらなる処理の準備を整えることができます。 列の型を検索して理解することで、機械学習自体はすべてのデータ (一部の null 値を含む) を一般的な数値型に変換することが完全に可能になります。もちろん、これにはデータの高度な変換や前処理は含まれておらず、データ サイエンティスト自身がさらにアクションを実行する必要があります。 対象タスクに対して、システムは適切な機械学習アルゴリズムを検索して選択する役割のみを担います。たとえば、現在のモバイル アプリケーション開発タスクに基づいて、自動化された機械学習アルゴリズムとモデルを設計し、データを前処理して、必要な予算、時間、その他の正確な結果を取得します。 データを前処理することで、自動化された機械学習システムは、特徴選択、次元削減、データ圧縮などの機能を構築および実装し、さまざまなトレーニングタスクをシームレスに実行できます。 3. 適切な機械学習アーキテクチャを見つける 前述の第 1 レベルおよび第 2 レベルの自動化された機械学習システムは、データの性質に基づいて適切な機械学習アーキテクチャを積極的に検出し、実行を通じて優れた出力を保証することができないことは明らかです。 3 番目のレベルでは、AutoKeras などのオープンソースの自動機械学習ライブラリがニューラル アーキテクチャ検索 (NAS、ニューラル アーキテクチャ検索、https://en.wikipedia.org/wiki/Neural_architecture_search を参照) を実装します。この人気の高いアーキテクチャは、画像、音声、テキストに対して機械学習アルゴリズムを効果的に実装できます。 したがって、データ サイエンティストは、さまざまなニューラル アーキテクチャ検索アルゴリズムを使用して、自動化された機械学習のサポートと経験の蓄積を強化できます。実際の応用では、自動運転車、自動化された消費者サービスなどの分野で第 3 レベルの自動化された機械学習システムが採用されています。 4. 関連分野の知識の活用 機械学習システムに正確な出力を提供するには、データ、特にデータの範囲とそれをホストするシステムについての深い理解が不可欠です。複雑な人工知能の効果は、関連分野の知識を活用し、必要なすべての基準を念頭に置くことによってのみ実現できます。 既存の関連分野における知識の蓄積と実際のシナリオでのその使用により、最終結果の精度が間違いなく向上することがわかります。同時に、精度の向上により優れた予測機能が向上し、自動化された機械学習タスクに対する包括的なサポートが提供されます。したがって、この成熟度レベルのモデルは、コンテキスト ドメインの関連知識を増やし、明確な結果指向の記録によって、自動化された機械学習システムの精度を向上させることに重点を置いています。 自動化された機械学習の例データ サイエンスの研究に携わる人々は、さまざまなツールやソフトウェア ライブラリを使用して、実際のアプリケーション シナリオのニーズに応じて正確な出力を持つ自動化プロセスや機械学習システムを開発できます。 自動機械学習のためのオープンソースライブラリ現在、業界には、さまざまな自動機械学習をシステムに実装したいという開発者のニーズをサポートし、満たすことができるさまざまな種類のオープンソース ライブラリが存在します。 1. オートケラス ソフトウェア ライブラリは、開発者が GitHub 上で無料で使用できます。 Data Lab が開発した AutoKeras は、すべてのディープラーニング ツールへのアクセスを提供し、ディープラーニング モデルの全体的な機能を強化することを目的としています。次のコードは AutoKeras のアプリケーション例です。
Python ソースコード リンク: https://github.com/jhfjhfj1/autokeras 2. MLボックス MLBox は Python で書かれた別のオープンソース ライブラリです。データの前処理、クリーニング、フォーマットなどの機能を含む、自動機械学習のさまざまな機能をより迅速かつ容易に開発できるようになります。次のコード例は、データをインポートした後に前処理する方法を示しています。
Python ソースコード リンク: https://www.kaggle.com/axelderomblay/running-mlbox-auto-ml-package-on-titanic 3. 自動学習 Auto-sklearn は、もう 1 つのオープン ソースの自動機械学習サポート ライブラリです。適切な機械学習アルゴリズムを選択して、データのモデルと要件を調査します。ユーザー側でのハイパーパラメータ処理の必要性がなくなり、処理自体を実行できるようになります。次のコードは、データセットに Auto-sklearn を実装する例です。
Python ソースコード リンク: https://automated-machine-learning.github.io/auto-sklearn/master/ 自動化された機械学習ツール以下のツールは商用利用向けにリリースされていますが、広く使用されているだけでなく、自動化された機械学習の出力の品質も保証します。 データロボット DataRobot は、自動化された機械学習をサポートする最初のツールです。人工知能を実現できる高度なプラットフォームを提供し、ユーザーがさまざまな問題を解決するのを支援しながら、ユーザーは実行プロセスをあまり心配する必要がなく、簡単に希望する結果を得ることができます。 DataRobot API は予測をサポートするだけでなく、適切な方法を選択して出力結果を提供することで、マシンがプロセスを自動化できるようにします。 以下のコードは、DataRobot API のアプリケーション例です。データセットを使用して、患者が 30 日以内に各病院に再入院する確率を予測します。
Python ソースコード リンク: https://blog.datarobot.com/estimation-of-prediction-distributions-using-datarobot H2O.aiAI 対応のサービス プラットフォーム ツールとしてもう 1 つ挙げられるのが H2O です。主に無人運転のAI結果の出力など機械学習タスクを実行するために使用されます。 要約する上記のツールやソフトウェア ライブラリに加えて、Google AutoML (https://cloud.google.com/automl/) などの他の商用ソリューションも市場に出回っています。機械学習の概念を実装しながら自動データトレーニングを可能にし、優れた結果と予測を提供できます。現在、自動化された機械学習の効果が顕著になるにつれて、人工知能技術は継続的に強化されており、ますます多くの企業がそのようなシステムの出力結果から利益を得続けることができます。 原題: 初心者のための自動機械学習ガイド: 理解すべき 4 つの成熟度モデル、著者: Manoj Rupareliya [51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください] |
<<: 機械学習の卒業生は就職に不安を感じ始めています!卒業生と企業のどちらがより厳しいでしょうか?
>>: 多くのビッグデータサイエンティストが仕事を辞めた?理由を説明しましょう。
現在、あらゆる分野で革新的なテクノロジーを活用して産業のアップグレードを加速する方法が模索されており...
[[403381]]この記事はWeChatの公開アカウント「UP Technology Contro...
生成型人工知能 (AI) の急速な台頭は、企業が AI を導入する驚異的なスピードを浮き彫りにしてい...
これから起こることは、やがて起こるでしょう! OpenAIが開発者会議で正式発表した「GPTストア」...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
数日前、清華大学法学院のラオ・ドンヤン准教授が、コミュニティに顔認識アクセス制御システムを設置するこ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
2019年の注目産業よく知られている5G、ブロックチェーン、インターネットに加えてもう一つは人工知...
「すべての人にAI」の時代を迎え、多くの人が機械学習(ML)に何らかの形で触れるようになりました。...