Matplotlib の使用が難しいと感じるのはなぜですか?このマインドマップをまだ見ていないので

Matplotlib の使用が難しいと感じるのはなぜですか?このマインドマップをまだ見ていないので

序文

Matplotlib は、データの視覚化を簡単に作成できる人気の Python ライブラリです。ただし、新しいプロジェクトに着手するたびに、データ、パラメーター、グラフィックス、プロットの設定が非常にわかりにくく、面倒になる可能性があります。また、アプリケーションが異なるため、ヒストグラム、円グラフ、曲線グラフなどのどの凡例を選択すればよいかわかりません。仕事に適した視覚化を選択するのに役立つ優れたマインドマップを以下に示します。

このマインドマップの主な例を説明しましょう。

散布図

散布図は、データの生の分布を直接確認できるため、2 つの変数の関係を示すのに最適です。次の画像に示すように、グループを色分けすることで、さまざまなデータ グループ間の関係を確認することもできます。

3 つの変数の関係を視覚化したいですか? まったく問題ありません! 下の 2 番目のプロットに示すように、別のパラメーター (ポイント サイズなど) を使用して 3 番目の変数をエンコードするだけです。これをバブル プロットと呼びます。

散布図関数の例:

  1. 散布図(x_data,y_data,s= 10 ,color=カラー,alpha= 0.75 )

折れ線グラフ

折れ線グラフは、ある変数が他の変数と大きく異なることが明確にわかる場合に最適です。説明のために次の図を見てみましょう。すべての専攻の割合が時間の経過とともに大きく変化することがはっきりとわかります。これらを散布図でプロットすると、非常に雑然としてしまい、何が起こっているのかを実際に理解して確認することが難しくなります。直線グラフは基本的に 2 つの変数 (パーセンテージと時間) の共分散の概要を示すため、この状況に最適です。同様に、色分けによるグループ化も使用できます。

折れ線グラフのコード例:

  1. プロット(x_data, y_data, lw = 2 , color = '#539caf' , alpha = 1 )

ヒストグラム

ヒストグラムは、データ ポイントの分布を確認 (または実際に発見) するのに役立ちます。下の棒グラフを見てください。ここでは、頻度と IQ の棒グラフをプロットしています。中心への集中度と中央値が明確にわかります。また、ガウス分布に従っていることもわかります。散布図ではなく棒グラフを使用すると、各ビンの頻度間の相対的な違いを明確に確認できます。ビン(離散化)を使用すると、「全体像」を把握するのに非常に役立ちます。離散ビンを使用せずにすべてのデータ ポイントを使用すると、視覚化に多くのノイズが発生し、実際に何が起こっているのかを把握するのが難しくなるでしょう。

データ内の 2 つの変数の分布を比較するとします。 2 つのヒストグラムを別々に作成し、並べて比較する必要があると考える人もいるかもしれません。しかし、実際にはもっと良い方法があります。それは、さまざまなレベルの透明度でヒストグラムを重ね合わせることです。下の写真を見てください。背後が見えるように、Uniform Distribution の透明度を 0.5 に設定します。これにより、同じプロット上で両方の分布を直接表示できるようになります。

ヒストグラムのコード例:

  1. hist(データ、n_bins = n_bins、累積 = 累積、色 = '#539caf' )

棒グラフ

棒グラフは、カテゴリ数が非常に少ない (おそらく 10 未満) カテゴリ データを視覚化する場合、最も効果的です。カテゴリが多すぎると、グラフのバーが非常に乱雑になり、理解しにくくなります。バーのサイズに基づいてデータをプロットできるため、カテゴリデータに最適です。カテゴリを分割したり、色分けしたりすることも簡単です。ここでは、通常、グループ化、積み上げの 3 種類の棒グラフを見ていきます。

従来の棒グラフコードの例:

  1. bar(x_data, y_data, 色 = '#539caf' 、配置 = 'center' )

グループ化されたチャートのコード例:

  1. foriinrange( 0 ,len(y_data_list)): i == 0 の場合: bar(x_data,y_data_list[i],color=colors[i],align= 'center' ,label=y_data_names[i])そうでない場合: bar(x_data,y_data_list[i],color=colors[i],bottom=y_data_list[i - 1 ],align= 'center' ,label=y_data_names[i])

積み上げグラフのコードの例:

  1. i が範囲( 0 、 len(y_data_list))場合:bar(x_data+alteration[i]、y_data_list[i]、color=colors[i]、label=y_data_names[i]、width=ind_width)

<<:  主流のブロックチェーンコンセンサスアルゴリズムの包括的なガイド

>>:  25倍のパフォーマンス向上: RustはCとC++に取って代わり、機械学習のPythonバックエンドとして好まれるようになると期待されています。

ブログ    

推薦する

...

なぜスパムメールがこんなに多いのでしょうか? Redditの男が機械学習の残酷な現実を暴露

近年、AIのトレンドは高まるばかりで、毎年大規模な機械学習カンファレンスが盛んに開催されており、誰も...

機械学習における不均衡なクラスに対処するための 5 つの戦略

クラスの不均衡: 希少疾患の機械学習データセット(陽性が約 8%)があるとします。この場合、トレーニ...

2021年の新ドローンの在庫

[[441702]]時は経つのが早く、2021年も過ぎ去りつつあります。今年を振り返ると、疫病の影響...

Google、AIロボットが人間に危害を加えないことを保証する「ロボット憲法」を起草

グーグルのディープマインドは1月5日、3つの新たな開発を発表した。その1つは、AIロボットが人間に危...

【ビッグガイがやってくるエピソード7】スマートショッピングガイド対話ロボットの実践

[51CTO.com からのオリジナル記事] 現在の電子商取引業界は比較的成熟しており、さまざまな形...

企業におけるAIの応用は成熟段階に入ったのでしょうか?

マッキンゼーは、AI が多くの業務活動を自動化するという見通しに楽観的である一方で、あらゆる規模の自...

...

世界トップ10のAIトレーニングチップの包括的なレビュー

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

HTTPS の暗号化アルゴリズムに関連する概念

[[176353]]暗号化はコンピュータサイエンスで広く使用されており、HTTPS は暗号化に基づい...

2020年世界人工知能会議が開催されます! AI が人間の言語の高度な能力をいかにして習得するかをご覧ください。

2020年7月9日、2020年世界人工知能大会(WAIC)クラウドサミットが正式に開幕しました。I...

人工知能の世界的競争が激化する中、主導権を握るのは中国か米国か?

世界的な技術競争において、人工知能は他の追随を許さない世界的な技術革新の新たな局面において、人工知能...

...

...

ビッグデータに責任を負わせないでください。スモールデータをうまく活用する方が効果的かもしれません。

誰もがビッグ データについて語っていますが、大規模なデータ セットを処理するにはより多くのストレージ...