Matplotlib の使用が難しいと感じるのはなぜですか?このマインドマップをまだ見ていないので

Matplotlib の使用が難しいと感じるのはなぜですか?このマインドマップをまだ見ていないので

序文

Matplotlib は、データの視覚化を簡単に作成できる人気の Python ライブラリです。ただし、新しいプロジェクトに着手するたびに、データ、パラメーター、グラフィックス、プロットの設定が非常にわかりにくく、面倒になる可能性があります。また、アプリケーションが異なるため、ヒストグラム、円グラフ、曲線グラフなどのどの凡例を選択すればよいかわかりません。仕事に適した視覚化を選択するのに役立つ優れたマインドマップを以下に示します。

このマインドマップの主な例を説明しましょう。

散布図

散布図は、データの生の分布を直接確認できるため、2 つの変数の関係を示すのに最適です。次の画像に示すように、グループを色分けすることで、さまざまなデータ グループ間の関係を確認することもできます。

3 つの変数の関係を視覚化したいですか? まったく問題ありません! 下の 2 番目のプロットに示すように、別のパラメーター (ポイント サイズなど) を使用して 3 番目の変数をエンコードするだけです。これをバブル プロットと呼びます。

散布図関数の例:

  1. 散布図(x_data,y_data,s= 10 ,color=カラー,alpha= 0.75 )

折れ線グラフ

折れ線グラフは、ある変数が他の変数と大きく異なることが明確にわかる場合に最適です。説明のために次の図を見てみましょう。すべての専攻の割合が時間の経過とともに大きく変化することがはっきりとわかります。これらを散布図でプロットすると、非常に雑然としてしまい、何が起こっているのかを実際に理解して確認することが難しくなります。直線グラフは基本的に 2 つの変数 (パーセンテージと時間) の共分散の概要を示すため、この状況に最適です。同様に、色分けによるグループ化も使用できます。

折れ線グラフのコード例:

  1. プロット(x_data, y_data, lw = 2 , color = '#539caf' , alpha = 1 )

ヒストグラム

ヒストグラムは、データ ポイントの分布を確認 (または実際に発見) するのに役立ちます。下の棒グラフを見てください。ここでは、頻度と IQ の棒グラフをプロットしています。中心への集中度と中央値が明確にわかります。また、ガウス分布に従っていることもわかります。散布図ではなく棒グラフを使用すると、各ビンの頻度間の相対的な違いを明確に確認できます。ビン(離散化)を使用すると、「全体像」を把握するのに非常に役立ちます。離散ビンを使用せずにすべてのデータ ポイントを使用すると、視覚化に多くのノイズが発生し、実際に何が起こっているのかを把握するのが難しくなるでしょう。

データ内の 2 つの変数の分布を比較するとします。 2 つのヒストグラムを別々に作成し、並べて比較する必要があると考える人もいるかもしれません。しかし、実際にはもっと良い方法があります。それは、さまざまなレベルの透明度でヒストグラムを重ね合わせることです。下の写真を見てください。背後が見えるように、Uniform Distribution の透明度を 0.5 に設定します。これにより、同じプロット上で両方の分布を直接表示できるようになります。

ヒストグラムのコード例:

  1. hist(データ、n_bins = n_bins、累積 = 累積、色 = '#539caf' )

棒グラフ

棒グラフは、カテゴリ数が非常に少ない (おそらく 10 未満) カテゴリ データを視覚化する場合、最も効果的です。カテゴリが多すぎると、グラフのバーが非常に乱雑になり、理解しにくくなります。バーのサイズに基づいてデータをプロットできるため、カテゴリデータに最適です。カテゴリを分割したり、色分けしたりすることも簡単です。ここでは、通常、グループ化、積み上げの 3 種類の棒グラフを見ていきます。

従来の棒グラフコードの例:

  1. bar(x_data, y_data, 色 = '#539caf' 、配置 = 'center' )

グループ化されたチャートのコード例:

  1. foriinrange( 0 ,len(y_data_list)): i == 0 の場合: bar(x_data,y_data_list[i],color=colors[i],align= 'center' ,label=y_data_names[i])そうでない場合: bar(x_data,y_data_list[i],color=colors[i],bottom=y_data_list[i - 1 ],align= 'center' ,label=y_data_names[i])

積み上げグラフのコードの例:

  1. i が範囲( 0 、 len(y_data_list))場合:bar(x_data+alteration[i]、y_data_list[i]、color=colors[i]、label=y_data_names[i]、width=ind_width)

<<:  主流のブロックチェーンコンセンサスアルゴリズムの包括的なガイド

>>:  25倍のパフォーマンス向上: RustはCとC++に取って代わり、機械学習のPythonバックエンドとして好まれるようになると期待されています。

ブログ    

推薦する

小型モデルは大型モデルとどう比較できるのか?北京理工大学はMindの大型モデルであるMindLLMをリリースし、小型モデルの大きな可能性を示した。

大規模言語モデル (LLM) は、さまざまな自然言語タスクで優れたパフォーマンスを発揮しています。た...

...

IDC: 中国のAI投資は2027年までに381億ドルに達すると予想

IDC は、2027 年までに人工知能への世界総投資額が 4,236 億米ドルに達し、2022 年か...

...

...

大規模言語モデルとAIコードジェネレータの台頭

翻訳者 |李睿レビュー | Chonglouこの記事の著者であるMartin Heller は、 W...

建設における人工知能の能力と限界

AI は、建設業界が大規模なインフラ プロジェクトを計画、実行、管理する方法に革命をもたらし、組織が...

...

生体認証:デジタル時代への突入

生体認証とは、ある人物の特定の生物学的特徴に基づいてその人物を識別する技術の使用を指します。テクノロ...

注目すべき中国の創造物:ユビキタス人工知能が夢を現実にする

人工知能はどこから来たのでしょうか? 人工知能は人類をどこへ連れて行くのでしょうか? 人工知能は「見...

Microsoft が NaturalSpeech2 音声合成モデルを発表: 音声再構成は「より正確」になり、「行き詰まる」こともなくなる

マイクロソフトは7月27日、NaturalSpeech2という音声モデルを発表しました。このモデルは...

人工知能ブームの背景にある産業チェーンのレイアウト分析

「新世代人工知能発展計画」の発表に伴い、国務院は我が国の人工知能発展計画を全体的に展開し始めました。...

動きながら描くと、2次元の人物になります:リアルタイムインタラクティブビデオスタイル化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能がまだできない5つのこと

人工知能(AI)は、さまざまな産業の変革と複雑なタスクの簡素化において目覚ましい進歩を遂げてきました...

美術系の学生は皆AIを崇拝しており、写真はすぐに絵画に描ける

ピエロの写真を入力するだけです。このプログラムは、油絵の肖像画を一筆一筆描いていく画家のようなもので...