PyCaret: 機械学習モデルの開発が簡単に

今日の急速に変化するデジタル世界では、組織はローコード/ノーコード (LC/NC) アプリケーションを使用して、新しい情報システムを迅速に構築します。この記事では、Python で書かれたローコード機械学習ライブラリである PyCaret を紹介します。

PyCaret は、R プログラミング言語の Caret (Classification And REgression Training の略) パッケージの Python バージョンであり、多くの利点があります。

作業効率を向上: PyCaret は、作業効率を向上できるローコードライブラリです。コーディングに費やす時間が短縮されるため、あなたとあなたのチームはビジネス上の問題に集中できるようになります。

使いやすい:この使いやすい機械学習ライブラリを使用すると、少ないコード行数でエンドツーエンドの機械学習実験を実行できます。

市販: PyCaret は市販のソリューションです。選択したノートブック環境内から迅速かつ効率的にプロトタイプを作成できます。

Python で仮想環境を作成し、次のコマンドを実行して PyCaret のフルバージョンをインストールできます。

 pip インストールpycaret [ フル]

機械学習の専門家は、分類、回帰、クラスタリング、異常検出、自然言語処理、関連ルールマイニング、時系列分析に PyCaret を使用できます。

PyCaret を使用した分類モデルの構築

この記事では、PyCaret のデータリポジトリから Iris データセットを取得し、PyCaret を使用して分類モデルを構築する方法について説明します。

作業を簡単にするために Google Colab 環境を使用し、以下の手順に従います。

ステップ1

まず、次のコマンドを実行して PyCaret をインストールします。

 pip インストールpycaret

ステップ2

次に、図 2 に示すようにデータセットを読み込みます。

データセットの読み込み

 pycaret.datasets からget_data をインポートする
データセット= get_data ( 'iris' )
 （または）
 pandasをpd としてインポートする
データセット= pd.read_csv ('/path_to_data/ file.csv ' )

ステップ3

次に、図 2 に示すように PyCaret 環境を設定します。

PyCaret 環境の設定

 pycaret からの分類インポート*
 clf1 = セットアップ( データ= データセット、 ターゲット= '種' )

PyCaret環境設定結果

PyCaret を使用してあらゆるタイプのモデルを構築する場合、環境設定が最も重要なステップです。デフォルトでは、setup() 関数は引数データ (Pandas データフレーム) とターゲット (データセット内のクラスラベル変数へのポインター) を受け入れます。 setup() 関数の結果を図 3 に示します。デフォルトでは、setup() 関数はデータの 70% をトレーニングセットに、30% をテストセットに分割し、図 3 に示すようにデータの前処理を実行します。

ステップ4

次に、図 4 に示すように、最適なモデルを見つけます。

最適なモデルを見つける

 ベスト= compare_models ()

デフォルトでは、compare_models() は 10 倍のクロス検証を適用し、図 4 に示すように、より短いトレーニング時間で、さまざまな分類器の精度、AUC、リコール、精度、F1 スコア、カッパ、MCC などのさまざまなパフォーマンスメトリックを計算します。 compare_models() 関数に tubro=True を渡すことで、すべての分類子を試すことができます。

ステップ5

次に、図 5 に示すようにモデルを作成します。

モデルの作成

 lda_model = create_model ( 'lda' )

図 4 に示すように、線形判別分析分類器は良好なパフォーマンスを示しました。したがって、lda を create_model() 関数に渡すことで、モデルを適合させることができます。

ステップ6

次のステップは、図 6 に示すように、モデルを微調整することです。

モデルの調整

 チューニングされたlda = チューニングモデル( lda_model )

ハイパーパラメータを調整すると、モデルの精度が向上します。 tune_model() 関数は、図 7 に示すように、線形判別分析モデルの精度を 0.9818 から 0.9909 に向上させます。

調整されたモデルの詳細

ステップ7

次のステップは、図 8 に示すように予測を行うことです。

調整されたモデルを使用した予測

 予測= predict_model ( tuned_lda )

predict_model() 関数は、テストデータ内に存在するサンプルの予測を行うために使用されます。

ステップ8

次に、図 9 に示すように、モデルのパフォーマンスをプロットします。

モデルのパフォーマンスの評価とプロット - 混同行列

 評価モデル( tuned_lda )

最小限の労力でさまざまなパフォーマンスメトリックを開発するには、evaluate_model() 関数を使用します。試してみて、出力を確認することができます。

<<: 模倣学習: ロボットはプログラミングなしで自然言語を理解できます!

>>: エイリアンがトレンド検索リストのトップに！米国が初のUFO公聴会を開催

2020年東京五輪の秘密兵器が暴露される：AIは計時を担当するだけでなく、審判員の職を失わせる

PyCaret: 機械学習モデルの開発が簡単に

PyCaret を使用した分類モデルの構築

ステップ1

ステップ2

ステップ3

ステップ4

ステップ5

ステップ6

ステップ7

ステップ8

2020年東京五輪の秘密兵器が暴露される：AIは計時を担当するだけでなく、審判員の職を失わせる

人工知能は一般的な仕事に取って代わるのでしょうか？心配しないで、この機会をつかんで次の10年をリードしてください

TikTok本社は米国に残り、ByteDanceが管理権とコアアルゴリズムを保持する

人工知能業界では無視できない技術分野「ナレッジグラフ」

ディープラーニングの成果は収穫されようとしているのでしょうか? 11人の専門家がAIの現在（2018年）と未来（2019年）について語る

自動運転テストシステムを1つの記事で理解する

ディープラーニングの基本概念のチートシート

UniVision: BEV 検出と Occ、デュアル SOTA の統合フレームワーク!

ディープラーニングデータセットを管理するための新しいアプローチ

推薦する

マイクロソフトのGitHub Copilotサービスは大きな損失を被っていると報じられており、同社は独自のAIチップを開発してNvidiaに対抗する予定だ

5G+UAVの利点

「深く」「鮮明に」見る - 画像の超高精細化におけるディープラーニングの応用

防衛とセキュリティの再定義に貢献するAIスタートアップ

Sinovationは、あらゆるもののインテリジェントな接続を促進するエッジインテリジェンスプラットフォームTurboXを立ち上げました。

200語あれば本一冊分は読める。GPT-3はすでに小説の要約を書くことができる

2021年に注目すべき5つのAIと機械学習のトレンド

音声によるやりとりをより自然にするにはどうすればよいでしょうか?まずはこれら 6 つの重要な知識ポイントをマスターしましょう。

人工知能は人間と議論できる：冒頭の発言は素晴らしかったが、それでもプロの討論者に負けた

Microsoft が 8 つの Nvidia H100 GPU を搭載した Azure ND H100 v5 仮想マシンをリリース

ChatGPTに対抗できるAIモデル6つと中国企業の製品2つが選定