Python 2年生 で、エラーになっていたので。。
Matplotlibの日本語表記が、エラーになっていました。なんでかな??って思って、ちょっと調べてみました。 フォントの指定をしないと日本語表示しないようです。
!pip install japanize_matplotlib
import matplotlib.pyplot as plt import japanize_matplotlib import seaborn as sns sns.set(font="IPAexGothic")
これだけです。「おまじない」ですね(笑)
今まであんまり気にしなかったけど、日本語入りのデータをプロットするときに日本語が出ないと困りますもんね。。 詳しいことは、こちらに書いておきました。
フォントの指定にSeabornを使っているので、Seabornを使ってみたくなりました(笑) ので、ちょっと余計なサンプルがついています。
Seaborn モジュール
超簡単にいうと。。Matplotlib の中に、pyplotっていう便利な関数群があって、それをもっと便利に綺麗にかけるようにした仕組みがSeabornって感じです。
で。。日本語入りのデータを探そうと。。東京都オープンデータカタログから、データを取ってきました。
小平市のデータがよかったんですが、な~い ので(笑) 一番上にあった三鷹市の町別の人口を拝借してみました。
これが、また紛らわしいデータなのですが。。 (笑)
Seabornの良いところは、pandasのDataFrame形式で読み込んでおくと。。
sns.pairplot(df)
こういう関数一発で、それぞれの関係を、こんな感じでグラフ化してくれます。
ちゃんと日本語になってますね(笑)
で・・・
ヒストグラム見て。。こんなに偏ってる??? って疑問になるじゃないですか!(笑)
な~んか おかしい(笑)
大きい値が入っていそうですよね。。
で、よくよく調べてみると。。 途中に、小計というデータが入っていました(笑)
で。。それを取り除くと。
少しまともになりましたね。。 というか。。このサンプルは、実はデータのクレンジング(オカシイところを削除する)サンプルかも知れません(笑)
で。。
最終的に正しく入ったデータで書くと こんな感じです。
それでも、どこかの町だけ、人口突出してますね(笑)
どこだろう??って調べてみたら。。
下連雀3丁目 だけが 突出していますね。
あと、世帯数と総計 を 見てみたら。。
ほぼ1対2なんですね。。
ということは、2人家族がほとんどってことですね。。へーー
ということで。。。 日本語化されたseaborn、Matplotlib のpyplotの紹介でした。
日本語化されて、グラフで見れると、データ見やすいですね(笑)