Matplotlib の使用が難しいと感じるのはなぜですか?このマインドマップをまだ見ていないので

Matplotlib の使用が難しいと感じるのはなぜですか?このマインドマップをまだ見ていないので

序文

Matplotlib は、データの視覚化を簡単に作成できる人気の Python ライブラリです。ただし、新しいプロジェクトに着手するたびに、データ、パラメーター、グラフィックス、プロットの設定が非常にわかりにくく、面倒になる可能性があります。また、アプリケーションが異なるため、ヒストグラム、円グラフ、曲線グラフなどのどの凡例を選択すればよいかわかりません。仕事に適した視覚化を選択するのに役立つ優れたマインドマップを以下に示します。

このマインドマップの主な例を説明しましょう。

散布図

散布図は、データの生の分布を直接確認できるため、2 つの変数の関係を示すのに最適です。次の画像に示すように、グループを色分けすることで、さまざまなデータ グループ間の関係を確認することもできます。

3 つの変数の関係を視覚化したいですか? まったく問題ありません! 下の 2 番目のプロットに示すように、別のパラメーター (ポイント サイズなど) を使用して 3 番目の変数をエンコードするだけです。これをバブル プロットと呼びます。

散布図関数の例:

  1. 散布図(x_data,y_data,s= 10 ,color=カラー,alpha= 0.75 )

折れ線グラフ

折れ線グラフは、ある変数が他の変数と大きく異なることが明確にわかる場合に最適です。説明のために次の図を見てみましょう。すべての専攻の割合が時間の経過とともに大きく変化することがはっきりとわかります。これらを散布図でプロットすると、非常に雑然としてしまい、何が起こっているのかを実際に理解して確認することが難しくなります。直線グラフは基本的に 2 つの変数 (パーセンテージと時間) の共分散の概要を示すため、この状況に最適です。同様に、色分けによるグループ化も使用できます。

折れ線グラフのコード例:

  1. プロット(x_data, y_data, lw = 2 , color = '#539caf' , alpha = 1 )

ヒストグラム

ヒストグラムは、データ ポイントの分布を確認 (または実際に発見) するのに役立ちます。下の棒グラフを見てください。ここでは、頻度と IQ の棒グラフをプロットしています。中心への集中度と中央値が明確にわかります。また、ガウス分布に従っていることもわかります。散布図ではなく棒グラフを使用すると、各ビンの頻度間の相対的な違いを明確に確認できます。ビン(離散化)を使用すると、「全体像」を把握するのに非常に役立ちます。離散ビンを使用せずにすべてのデータ ポイントを使用すると、視覚化に多くのノイズが発生し、実際に何が起こっているのかを把握するのが難しくなるでしょう。

データ内の 2 つの変数の分布を比較するとします。 2 つのヒストグラムを別々に作成し、並べて比較する必要があると考える人もいるかもしれません。しかし、実際にはもっと良い方法があります。それは、さまざまなレベルの透明度でヒストグラムを重ね合わせることです。下の写真を見てください。背後が見えるように、Uniform Distribution の透明度を 0.5 に設定します。これにより、同じプロット上で両方の分布を直接表示できるようになります。

ヒストグラムのコード例:

  1. hist(データ、n_bins = n_bins、累積 = 累積、色 = '#539caf' )

棒グラフ

棒グラフは、カテゴリ数が非常に少ない (おそらく 10 未満) カテゴリ データを視覚化する場合、最も効果的です。カテゴリが多すぎると、グラフのバーが非常に乱雑になり、理解しにくくなります。バーのサイズに基づいてデータをプロットできるため、カテゴリデータに最適です。カテゴリを分割したり、色分けしたりすることも簡単です。ここでは、通常、グループ化、積み上げの 3 種類の棒グラフを見ていきます。

従来の棒グラフコードの例:

  1. bar(x_data, y_data, 色 = '#539caf' 、配置 = 'center' )

グループ化されたチャートのコード例:

  1. foriinrange( 0 ,len(y_data_list)): i == 0 の場合: bar(x_data,y_data_list[i],color=colors[i],align= 'center' ,label=y_data_names[i])そうでない場合: bar(x_data,y_data_list[i],color=colors[i],bottom=y_data_list[i - 1 ],align= 'center' ,label=y_data_names[i])

積み上げグラフのコードの例:

  1. i が範囲( 0 、 len(y_data_list))場合:bar(x_data+alteration[i]、y_data_list[i]、color=colors[i]、label=y_data_names[i]、width=ind_width)

<<:  主流のブロックチェーンコンセンサスアルゴリズムの包括的なガイド

>>:  25倍のパフォーマンス向上: RustはCとC++に取って代わり、機械学習のPythonバックエンドとして好まれるようになると期待されています。

ブログ    

推薦する

不正行為防止スパムテキスト認識のためのZhihuのディープラーニング実践の詳細な説明

背景今年8月時点で、知乎の登録ユーザー数は2億人を突破した。私たちはスパムの管理において、より大きな...

数学者は解けないコンピュータの問題を発見した

最近、海外メディアの報道によると、数学者たちは自分たちには解決できない機械学習に関連したコンピュータ...

...

紙画像の不正使用? AI: この道は私が塞いでいる

[[441681]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

建設業界には後継者がいないのでしょうか?考えすぎです!建設ロボットがやって来ます!

世界の建設業界の現状人口ボーナスの消滅により、中国の建設業界は人件費への大きな圧力に直面しているほか...

ペイ・ジアンのチームの44ページの新作:ディープラーニングモデルの複雑さを理解するには、これを読んでください

最近、ディープラーニング モデルの複雑性に関する最初のレビュー「ディープラーニングのモデルの複雑性:...

モノのインターネット – インド国防軍にとっての可能性

世界がインダストリー4.0へと向かうにつれ、モノのインターネットへの世界的な支出は2022年までに1...

張宏江:AIは開発を支配する次の法則になるかもしれない

9月11日午前、北京人工知能研究院会長の張宏江博士がHICOOL 2021グローバル起業家サミットに...

CIO 向けガイド: ジェネレーティブ AI の「ハイライト モーメント」を実現する 5 つの方法

あらゆる誇大宣伝と主流の採用率の高さにもかかわらず、生成 AI は生産性のピークに到達する前に、幻滅...

...

今後10年間で、AIは「スモールデータ」時代の到来を告げるでしょうか?

AI 研究に携わる人なら誰でも、データが AI の開発において重要な役割を果たすことをよく知ってい...

ハッシュアルゴリズムに基づくMySQLテーブルパーティション

以下に紹介する Mysql テーブルのパーティショニング プロセスは、ハッシュ アルゴリズムに基づい...

現在、中国における知能ロボットの開発状況はどうなっているのでしょうか?

インテリジェントロボットは、知覚、思考、効果の面で人間を完全にシミュレートする機械システムです。近年...

ブロックチェーンと人工知能は、どうすればお互いの「ゴールデンパートナー」になれるのでしょうか?

[[247978]]本質的には、「見知らぬ人同士がイベントの共有記録を信頼できるようにするための技...

機械学習では、いくつかの分類アルゴリズムが一般的に使用されています。適切なアルゴリズムを選択するにはどうすればよいでしょうか?

今日は、機械学習における一般的な分類アルゴリズム 6 つ (K 最近傍法、決定木、単純ベイズ、ロジス...