PyCaret: 機械学習モデルの開発が簡単に

PyCaret: 機械学習モデルの開発が簡単に

今日の急速に変化するデジタル世界では、組織はローコード/ノーコード (LC/NC) アプリケーションを使用して、新しい情報システムを迅速に構築します。この記事では、Python で書かれたローコード機械学習ライブラリである PyCaret を紹介します。

PyCaret は、R プログラミング言語の Caret (Classification And REgression Training の略) パッケージの Python バージョンであり、多くの利点があります。

作業効率を向上: PyCaret は、作業効率を向上できるローコード ライブラリです。コーディングに費やす時間が短縮されるため、あなたとあなたのチームはビジネス上の問題に集中できるようになります。

使いやすい:この使いやすい機械学習ライブラリを使用すると、少ないコード行数でエンドツーエンドの機械学習実験を実行できます。

市販: PyCaret は市販のソリューションです。選択したノートブック環境内から迅速かつ効率的にプロトタイプを作成できます。

Python で仮想環境を作成し、次のコマンドを実行して PyCaret のフルバージョンをインストールできます。

 pip インストールpycaret [ フル]

機械学習の専門家は、分類、回帰、クラスタリング、異常検出、自然言語処理、関連ルールマイニング、時系列分析に PyCaret を使用できます。

PyCaret を使用した分類モデルの構築

この記事では、PyCaret のデータ リポジトリから Iris データセットを取得し、PyCaret を使用して分類モデルを構築する方法について説明します。

作業を簡単にするために Google Colab 環境を使用し、以下の手順に従います。

ステップ1

まず、次のコマンドを実行して PyCaret をインストールします。

 pip インストールpycaret

ステップ2

次に、図 2 に示すようにデータセットを読み込みます。

データセットの読み込み

 pycaret.datasets からget_data インポートする
データセット= get_data ( 'iris' )
(または)
pandaspd としてインポートする
データセット= pd.read_csv ('/path_to_data/ file.csv ' )

ステップ3

次に、図 2 に示すように PyCaret 環境を設定します。

PyCaret 環境の設定

 pycaret からの分類インポート*
clf1 = セットアップ( データ= データセットターゲット= '種' )

PyCaret環境設定結果

PyCaret を使用してあらゆるタイプのモデルを構築する場合、環境設定が最も重要なステップです。デフォルトでは、setup() 関数は引数データ (Pandas データフレーム) とターゲット (データセット内のクラス ラベル変数へのポインター) を受け入れます。 setup() 関数の結果を図 3 に示します。デフォルトでは、setup() 関数はデータの 70% をトレーニング セットに、30% をテスト セットに分割し、図 3 に示すようにデータの前処理を実行します。

ステップ4

次に、図 4 に示すように、最適なモデルを見つけます。

最適なモデルを見つける

 ベスト= compare_models ()

デフォルトでは、compare_models() は 10 倍のクロス検証を適用し、図 4 に示すように、より短いトレーニング時間で、さまざまな分類器の精度、AUC、リコール、精度、F1 スコア、カッパ、MCC などのさまざまなパフォーマンス メトリックを計算します。 compare_models() 関数に tubro=True を渡すことで、すべての分類子を試すことができます。

ステップ5

次に、図 5 に示すようにモデルを作成します。

モデルの作成

 lda_model = create_model ( 'lda' )

図 4 に示すように、線形判別分析分類器は良好なパフォーマンスを示しました。したがって、lda を create_model() 関数に渡すことで、モデルを適合させることができます。

ステップ6

次のステップは、図 6 に示すように、モデルを微調整することです。

モデルの調整

 チューニングされたlda = チューニングモデル( lda_model )

ハイパーパラメータを調整すると、モデルの精度が向上します。 tune_model() 関数は、図 7 に示すように、線形判別分析モデルの精度を 0.9818 から 0.9909 に向上させます。

調整されたモデルの詳細

ステップ7

次のステップは、図 8 に示すように予測を行うことです。

調整されたモデルを使用した予測

 予測= predict_model ( tuned_lda )

predict_model() 関数は、テスト データ内に存在するサンプルの予測を行うために使用されます。

ステップ8

次に、図 9 に示すように、モデルのパフォーマンスをプロットします。

モデルのパフォーマンスの評価とプロット - 混同行列

 評価モデル( tuned_lda )

最小限の労力でさまざまなパフォーマンス メトリックを開発するには、evaluate_model() 関数を使用します。試してみて、出力を確認することができます。

<<:  模倣学習: ロボットはプログラミングなしで自然言語を理解できます!

>>:  エイリアンがトレンド検索リストのトップに!米国が初のUFO公聴会を開催

ブログ    
ブログ    
ブログ    

推薦する

AI が大学入試のエッセイのテーマを予測: 科学、形而上学、それとも誇大広告?

大学受験生にとって、出題される問題を全て知っていて、分からない問題の答えを暗記していることが一番幸せ...

機械学習初心者必読 | scikit-learn を使ったモデル構築のためのユニバーサル テンプレート

独自の機械学習モデルを構築するには、次の 2 つの手順だけが必要です。解決する必要がある問題の種類と...

東南大学が世界初のLK-99ゼロ耐性テストに成功しました!常温超伝導が再び出現、人類史は転換点に近づいている

室温超伝導を再現する実験は、完全に爆発的な成長期に突入しました!今朝午前1時過ぎ、東南大学の物理学教...

GPT-3は創造性に欠けるにもかかわらず、わずか20分で合格できる大学論文を書いた。

GPT-3で書かれた論文は通過したのでしょうか?教育リソースウェブサイトEduRefがこれに関する...

ついにAI、BI、ビッグデータ、データサイエンスをわかりやすく説明する人が出てきた

[[427319]] 01 データデータは、携帯電話に残すデジタルフットプリントから健康記録、買い物...

5G、IoT、AI、機械学習は2021年に最も重要なテクノロジーとなる

[[353503]]画像ソース: https://pixabay.com/images/id-575...

清華大学の卒業生は大きな貢献をしました! Google、14のタスクで初の大規模一般医療モデルSOTAをリリース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

NeRF と自動運転: 約 10 件の論文の概要!

Neural Radiance Fieldsは2020年に提案されて以来、関連論文が飛躍的に増加し...

AI画像認識は無関係? Google AI: 段階的なトレーニング セットで画像の説明精度を向上

絵を千語で説明できるとしたら、絵の中に描写できる詳細や物体間の関係性は実に多くあります。犬の毛の質感...

自動運転のためのマルチモーダルセンサーフュージョンのレビュー

2022年2月6日にarXivにアップロードされたレビュー論文「自動運転認識のためのマルチモーダルセ...

CVPR2019で、Baidu Apolloはレベル4自動運転向けの純粋なビジョンソリューションであるApollo Liteを発表しました。

米国現地時間6月16日から20日まで、コンピュータビジョンとパターン認識の分野における世界有数の学術...

CreditEase の R&D ディレクター、張振氏: 運用・保守ロボットのタスク決定システムの進化

[51CTO.comより引用] 2018年5月18日〜19日、51CTO主催のグローバルソフトウェア...

OpenAI が GPT-4 やその他のモデルを更新し、新しい API 関数呼び出しを追加し、価格を最大 75% 引き下げ

数日前、OpenAIのCEOサム・アルトマン氏は世界ツアーのスピーチで、OpenAIの最近の開発ルー...

...