パンナの学生生活

地方大学の大学生/プログラミング言語【python】を中心に紹介しています。/日々の脳内をアウトプット/麻雀とワインと日本酒が好き/将来は幸せになりたい

【python】matplotlibを使ってデータの可視化をしてみよう

matplotlibについて

matplotlibはデータ分析によく使われており、データを可視化する必要不可欠なライブラリです。matplotlibは、データサイエンスや機械学習人工知能にも使われるライブラリです。データを散布図や棒グラフ、円グラフ、ヒストグラムで表すこともできます。今日は、円グラフとバブルチャートについて紹介します。

ソースコードと説明

import numpy as np
import numpy.random as random

import matplotlib.pyplot as plt
import matplotlib as mpl
#グラフを表記する
%matplotlib inline
%precision 3

今回使うライブラリをインポートします。

#グラフのサイズを指定する。
plt.figure(figsize= (20,10))
#各要素の割合を指定する、explodeで円グラフを切り離す。
#ラベルの名前を指定、色の指定
plt.pie([10,30,45,15],
        explode=(0,0,0,0.1),
        labels = ['A','B','C','D'], 
        colors = ['yellowgreen','gold','skyblue','lightcoral'], 
        autopct = '%1.1f%%',shadow = True, startangle= 90)

plt.axis('equal')

 

f:id:panNakotta:20190504232432p:plain

このように表示される。

#データの個数を指定
N=100
#データをランダムに作る
x=np.random.rand(N)
y=np.random.rand(N)

#一つの円の大きさをバラバラにする
area = 10*np.pi*(15*np.random.rand(N))**2

plt.figure(figsize=(15,6))
#色のランダムに決める
plt.scatter(x,y,s = area,c =np.random.rand(N),alpha = 0.5)
plt.grid(True)

 

f:id:panNakotta:20190504233323p:plain


jupyter notebookについて

データ分析についてはjupyter notebookがとてもおすすめである。jupyter notebookはpythonコードをすぐに実行できるので、グラフも簡単に表示でき、エラーも見つけやすい。ぜひjupyterの環境を構築してみてください。

f:id:panNakotta:20190504234242p:plain

このように実行できる。

まとめ

データサイエンスはとても注目を浴びている。今日扱った内容は、ほんの一部ですが、多くの表示の仕方がある。データを分析することでデータの予測や現状の課題なども発見できる。ここで興味を持った方はぜひ自分でも手を動かしてみたり、調べてほしい。