Matplotlib の使用が難しいと感じるのはなぜですか?このマインドマップをまだ見ていないので

序文

Matplotlib は、データの視覚化を簡単に作成できる人気の Python ライブラリです。ただし、新しいプロジェクトに着手するたびに、データ、パラメーター、グラフィックス、プロットの設定が非常にわかりにくく、面倒になる可能性があります。また、アプリケーションが異なるため、ヒストグラム、円グラフ、曲線グラフなどのどの凡例を選択すればよいかわかりません。仕事に適した視覚化を選択するのに役立つ優れたマインドマップを以下に示します。

このマインドマップの主な例を説明しましょう。

散布図

散布図は、データの生の分布を直接確認できるため、2 つの変数の関係を示すのに最適です。次の画像に示すように、グループを色分けすることで、さまざまなデータグループ間の関係を確認することもできます。

3 つの変数の関係を視覚化したいですか? まったく問題ありません! 下の 2 番目のプロットに示すように、別のパラメーター (ポイントサイズなど) を使用して 3 番目の変数をエンコードするだけです。これをバブルプロットと呼びます。

散布図関数の例:

散布図(x_data,y_data,s= 10 ,color=カラー,alpha= 0.75 )

折れ線グラフ

折れ線グラフは、ある変数が他の変数と大きく異なることが明確にわかる場合に最適です。説明のために次の図を見てみましょう。すべての専攻の割合が時間の経過とともに大きく変化することがはっきりとわかります。これらを散布図でプロットすると、非常に雑然としてしまい、何が起こっているのかを実際に理解して確認することが難しくなります。直線グラフは基本的に 2 つの変数 (パーセンテージと時間) の共分散の概要を示すため、この状況に最適です。同様に、色分けによるグループ化も使用できます。

折れ線グラフのコード例:

プロット(x_data, y_data, lw = 2 , color = '#539caf' , alpha = 1 )

ヒストグラム

ヒストグラムは、データポイントの分布を確認 (または実際に発見) するのに役立ちます。下の棒グラフを見てください。ここでは、頻度と IQ の棒グラフをプロットしています。中心への集中度と中央値が明確にわかります。また、ガウス分布に従っていることもわかります。散布図ではなく棒グラフを使用すると、各ビンの頻度間の相対的な違いを明確に確認できます。ビン（離散化）を使用すると、「全体像」を把握するのに非常に役立ちます。離散ビンを使用せずにすべてのデータポイントを使用すると、視覚化に多くのノイズが発生し、実際に何が起こっているのかを把握するのが難しくなるでしょう。

データ内の 2 つの変数の分布を比較するとします。 2 つのヒストグラムを別々に作成し、並べて比較する必要があると考える人もいるかもしれません。しかし、実際にはもっと良い方法があります。それは、さまざまなレベルの透明度でヒストグラムを重ね合わせることです。下の写真を見てください。背後が見えるように、Uniform Distribution の透明度を 0.5 に設定します。これにより、同じプロット上で両方の分布を直接表示できるようになります。

ヒストグラムのコード例:

 hist(データ、n_bins = n_bins、累積 = 累積、色 = '#539caf' )

棒グラフ

棒グラフは、カテゴリ数が非常に少ない (おそらく 10 未満) カテゴリデータを視覚化する場合、最も効果的です。カテゴリが多すぎると、グラフのバーが非常に乱雑になり、理解しにくくなります。バーのサイズに基づいてデータをプロットできるため、カテゴリデータに最適です。カテゴリを分割したり、色分けしたりすることも簡単です。ここでは、通常、グループ化、積み上げの 3 種類の棒グラフを見ていきます。

従来の棒グラフコードの例:

 bar(x_data, y_data, 色 = '#539caf' 、配置 = 'center' )

グループ化されたチャートのコード例:

 foriinrange( 0 ,len(y_data_list)): i == 0 の場合: bar(x_data,y_data_list[i],color=colors[i],align= 'center' ,label=y_data_names[i])そうでない場合: bar(x_data,y_data_list[i],color=colors[i],bottom=y_data_list[i - 1 ],align= 'center' ,label=y_data_names[i])

積み上げグラフのコードの例:

 i が範囲( 0 、 len(y_data_list))の場合:bar(x_data+alteration[i]、y_data_list[i]、color=colors[i]、label=y_data_names[i]、width=ind_width)

<<: 主流のブロックチェーンコンセンサスアルゴリズムの包括的なガイド

>>: 25倍のパフォーマンス向上: RustはCとC++に取って代わり、機械学習のPythonバックエンドとして好まれるようになると期待されています。

Matplotlib の使用が難しいと感じるのはなぜですか?このマインドマップをまだ見ていないので

序文

散布図

折れ線グラフ

ヒストグラム

棒グラフ

ユビキタス「AI+」人工知能はこのように私たちの生活を変える

道路が車両を制御することが自動運転の新たな方向性となるのでしょうか?

GPT-4 の推論はより人間的です!中国科学院は「思考コミュニケーション」を提唱、類推思考はCoT、プラグアンドプレイよりも優れている

人工知能を始める、現実的な仕事の選び方は？

私の国の自動運転開発は、年初に巨額の資金提供を受けて大いに支持されている

脳とコンピュータをつなぐ技術が実現！未来の人類社会はどうなる？

フロンティアモデルフォーラムは責任あるAIの創造を目指している

2018 年に知っておくべき 15 の人工知能統計

推薦する

ロシアのロボット宇宙飛行士が3Dプリントされた骨組織サンプルを持って地球に帰還

若者がAI倫理について語り始めるとき

AIOps 初心者ガイド: 基本的な概念と機能

フォレスター：AIと5Gがエッジコンピューティングの発展を推進

AからZまで、人工知能が世界を変える26のキーワード

データ構造とアルゴリズムの基本概念

人工知能があなたの好きな家を見つけるお手伝いをします

医療の発展は自動化に向かっており、手術ロボットは急速に発展している。

マスク氏：ロボットが雇用を奪い、ユニバーサル・ベーシック・インカムが必須に

顔認識は常に私たちのそばにあり、中秋節は「ハッピースキャン」から始まります

チャットボットのテスト: フレームワーク、ツール、テクニックの詳細

統計と機械学習の違いは何ですか?

臨床研究における人工知能と機械学習の活用の機会をいかに捉えるか