序文Matplotlib は、データの視覚化を簡単に作成できる人気の Python ライブラリです。ただし、新しいプロジェクトに着手するたびに、データ、パラメーター、グラフィックス、プロットの設定が非常にわかりにくく、面倒になる可能性があります。また、アプリケーションが異なるため、ヒストグラム、円グラフ、曲線グラフなどのどの凡例を選択すればよいかわかりません。仕事に適した視覚化を選択するのに役立つ優れたマインドマップを以下に示します。 このマインドマップの主な例を説明しましょう。 散布図散布図は、データの生の分布を直接確認できるため、2 つの変数の関係を示すのに最適です。次の画像に示すように、グループを色分けすることで、さまざまなデータ グループ間の関係を確認することもできます。 3 つの変数の関係を視覚化したいですか? まったく問題ありません! 下の 2 番目のプロットに示すように、別のパラメーター (ポイント サイズなど) を使用して 3 番目の変数をエンコードするだけです。これをバブル プロットと呼びます。 散布図関数の例:
折れ線グラフ折れ線グラフは、ある変数が他の変数と大きく異なることが明確にわかる場合に最適です。説明のために次の図を見てみましょう。すべての専攻の割合が時間の経過とともに大きく変化することがはっきりとわかります。これらを散布図でプロットすると、非常に雑然としてしまい、何が起こっているのかを実際に理解して確認することが難しくなります。直線グラフは基本的に 2 つの変数 (パーセンテージと時間) の共分散の概要を示すため、この状況に最適です。同様に、色分けによるグループ化も使用できます。 折れ線グラフのコード例:
ヒストグラムヒストグラムは、データ ポイントの分布を確認 (または実際に発見) するのに役立ちます。下の棒グラフを見てください。ここでは、頻度と IQ の棒グラフをプロットしています。中心への集中度と中央値が明確にわかります。また、ガウス分布に従っていることもわかります。散布図ではなく棒グラフを使用すると、各ビンの頻度間の相対的な違いを明確に確認できます。ビン(離散化)を使用すると、「全体像」を把握するのに非常に役立ちます。離散ビンを使用せずにすべてのデータ ポイントを使用すると、視覚化に多くのノイズが発生し、実際に何が起こっているのかを把握するのが難しくなるでしょう。 データ内の 2 つの変数の分布を比較するとします。 2 つのヒストグラムを別々に作成し、並べて比較する必要があると考える人もいるかもしれません。しかし、実際にはもっと良い方法があります。それは、さまざまなレベルの透明度でヒストグラムを重ね合わせることです。下の写真を見てください。背後が見えるように、Uniform Distribution の透明度を 0.5 に設定します。これにより、同じプロット上で両方の分布を直接表示できるようになります。 ヒストグラムのコード例:
棒グラフ棒グラフは、カテゴリ数が非常に少ない (おそらく 10 未満) カテゴリ データを視覚化する場合、最も効果的です。カテゴリが多すぎると、グラフのバーが非常に乱雑になり、理解しにくくなります。バーのサイズに基づいてデータをプロットできるため、カテゴリデータに最適です。カテゴリを分割したり、色分けしたりすることも簡単です。ここでは、通常、グループ化、積み上げの 3 種類の棒グラフを見ていきます。 従来の棒グラフコードの例:
グループ化されたチャートのコード例:
積み上げグラフのコードの例:
|
<<: 主流のブロックチェーンコンセンサスアルゴリズムの包括的なガイド
>>: 25倍のパフォーマンス向上: RustはCとC++に取って代わり、機械学習のPythonバックエンドとして好まれるようになると期待されています。
科学の最前線から世界を眺め、熱心に学び、宇宙を理解するホーキング博士はかつて、人工知能(AI)の発達...
2002年から2012年までの石炭の「黄金の10年」を経験した後、「古い工業基地」である山西省太原市...
ハルビンで開催された2019年中国科学技術協会年次大会において、情報技術分野のハイエンドシンクタンク...
昨日、ネットユーザーから、数学オリンピックを勉強したことがないのにシステムアーキテクトになれるかと質...
[[186262]]この人工知能の波は急速に到来し、画像認識、音声認識、自動運転など、多くの難題を次...
日本の独立系開発者佐藤氏はアスペルガー症候群のため学校を中退、退職。その後独学でAIを学び、AI画伯...
著者 | ツァミア・アンサリ企画 | ヤン・ジェンマイクロソフトは、ソフトウェア大手の元CEO、ステ...
まず、Zhihu の「アルゴリズム エンジニアになるのはどんな感じか」という質問に対する私の回答を共...
1. ランキングの計算式にはどのような指標が含まれていますか?指標 A、B、C とは何ですか? 重み...
TensorFlow については、機械学習関係者ならよくご存知でしょう。TensorFlow は、...