PyCaret: 機械学習モデルの開発が簡単に

PyCaret: 機械学習モデルの開発が簡単に

今日の急速に変化するデジタル世界では、組織はローコード/ノーコード (LC/NC) アプリケーションを使用して、新しい情報システムを迅速に構築します。この記事では、Python で書かれたローコード機械学習ライブラリである PyCaret を紹介します。

PyCaret は、R プログラミング言語の Caret (Classification And REgression Training の略) パッケージの Python バージョンであり、多くの利点があります。

作業効率を向上: PyCaret は、作業効率を向上できるローコード ライブラリです。コーディングに費やす時間が短縮されるため、あなたとあなたのチームはビジネス上の問題に集中できるようになります。

使いやすい:この使いやすい機械学習ライブラリを使用すると、少ないコード行数でエンドツーエンドの機械学習実験を実行できます。

市販: PyCaret は市販のソリューションです。選択したノートブック環境内から迅速かつ効率的にプロトタイプを作成できます。

Python で仮想環境を作成し、次のコマンドを実行して PyCaret のフルバージョンをインストールできます。

 pip インストールpycaret [ フル]

機械学習の専門家は、分類、回帰、クラスタリング、異常検出、自然言語処理、関連ルールマイニング、時系列分析に PyCaret を使用できます。

PyCaret を使用した分類モデルの構築

この記事では、PyCaret のデータ リポジトリから Iris データセットを取得し、PyCaret を使用して分類モデルを構築する方法について説明します。

作業を簡単にするために Google Colab 環境を使用し、以下の手順に従います。

ステップ1

まず、次のコマンドを実行して PyCaret をインストールします。

 pip インストールpycaret

ステップ2

次に、図 2 に示すようにデータセットを読み込みます。

データセットの読み込み

 pycaret.datasets からget_data インポートする
データセット= get_data ( 'iris' )
(または)
pandaspd としてインポートする
データセット= pd.read_csv ('/path_to_data/ file.csv ' )

ステップ3

次に、図 2 に示すように PyCaret 環境を設定します。

PyCaret 環境の設定

 pycaret からの分類インポート*
clf1 = セットアップ( データ= データセットターゲット= '種' )

PyCaret環境設定結果

PyCaret を使用してあらゆるタイプのモデルを構築する場合、環境設定が最も重要なステップです。デフォルトでは、setup() 関数は引数データ (Pandas データフレーム) とターゲット (データセット内のクラス ラベル変数へのポインター) を受け入れます。 setup() 関数の結果を図 3 に示します。デフォルトでは、setup() 関数はデータの 70% をトレーニング セットに、30% をテスト セットに分割し、図 3 に示すようにデータの前処理を実行します。

ステップ4

次に、図 4 に示すように、最適なモデルを見つけます。

最適なモデルを見つける

 ベスト= compare_models ()

デフォルトでは、compare_models() は 10 倍のクロス検証を適用し、図 4 に示すように、より短いトレーニング時間で、さまざまな分類器の精度、AUC、リコール、精度、F1 スコア、カッパ、MCC などのさまざまなパフォーマンス メトリックを計算します。 compare_models() 関数に tubro=True を渡すことで、すべての分類子を試すことができます。

ステップ5

次に、図 5 に示すようにモデルを作成します。

モデルの作成

 lda_model = create_model ( 'lda' )

図 4 に示すように、線形判別分析分類器は良好なパフォーマンスを示しました。したがって、lda を create_model() 関数に渡すことで、モデルを適合させることができます。

ステップ6

次のステップは、図 6 に示すように、モデルを微調整することです。

モデルの調整

 チューニングされたlda = チューニングモデル( lda_model )

ハイパーパラメータを調整すると、モデルの精度が向上します。 tune_model() 関数は、図 7 に示すように、線形判別分析モデルの精度を 0.9818 から 0.9909 に向上させます。

調整されたモデルの詳細

ステップ7

次のステップは、図 8 に示すように予測を行うことです。

調整されたモデルを使用した予測

 予測= predict_model ( tuned_lda )

predict_model() 関数は、テスト データ内に存在するサンプルの予測を行うために使用されます。

ステップ8

次に、図 9 に示すように、モデルのパフォーマンスをプロットします。

モデルのパフォーマンスの評価とプロット - 混同行列

 評価モデル( tuned_lda )

最小限の労力でさまざまなパフォーマンス メトリックを開発するには、evaluate_model() 関数を使用します。試してみて、出力を確認することができます。

<<:  模倣学習: ロボットはプログラミングなしで自然言語を理解できます!

>>:  エイリアンがトレンド検索リストのトップに!米国が初のUFO公聴会を開催

ブログ    

推薦する

AIoTの生死に関わる状況:将来的にはAIoTは非常に収益性が高いが、現時点ではAI+IoTは非常に高価

Huawei が初めて AIoT 戦略を発表したり、JD.com が IoT 事業を Xiaojin...

...

無人公共交通機関が議題に上がっており、自動運転はまだ改善の余地がある

10月21日、蘇州で5G無人バスの定期運行が開始された。蘇州高速鉄道新城でデビューしたこの無人バスは...

最も人気のある 5 つの人工知能プログラミング言語の比較。1 つだけでも学ぶ価値があります。

ほとんどのソフトウェア アプリケーション開発と同様に、開発者は複数の言語を使用して AI プロジェク...

...

AI作曲家の出現により、人類はどこへ向かうべきでしょうか?

AIを使って音楽を作曲した場合、AIが作曲した音楽と人間が作曲した音楽を区別できますか?今日はその...

データセンター不足がAIの未来を阻害している理由

多くの企業が AI テクノロジーの開発と導入に数十億ドルを投資しています。知的財産の問題、潜在的な規...

Raspberry Pi の「リス対策アーティファクト」が Reddit で人気に。13 行のコードで AI があなたの代わりに食べ物を守れる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

画像の混合を利用してより細かい特徴表現を学習するCMU Xing Boのチームの新しい論文がAAAIに選出されました

これは、カーネギーメロン大学とカリフォルニア大学バークレー校の Eric Xing 氏と Trevo...

...

未来の都市: スマートテクノロジーが持続可能な革命をリードする方法

最近の急速な技術発展により、真のスマートシティの時代が近づいてきました。人工知能、クラウドおよびエッ...

コンピュータービジョン技術によって変革が期待できる3つの業界

コンピューター ビジョン テクノロジー (マシン ビジョンとも呼ばれます) により、機械は周囲の世界...

...

Amazon が企業による生成 AI の利用を支援する新機能と Bedrock を発表

Amazon Web Services Inc. は本日、自社のエコシステムにおいて、企業顧客が独自...

...