【Python66】 MatplotlibのGoogle colabでの日本語化とSeabornでのグラフサンプル【Google Colab】

Python 2年生 で、エラーになっていたので。。

Matplotlibの日本語表記が、エラーになっていました。なんでかな??って思って、ちょっと調べてみました。 フォントの指定をしないと日本語表示しないようです。

!pip install japanize_matplotlib
import matplotlib.pyplot as plt
import japanize_matplotlib 
import seaborn as sns

sns.set(font="IPAexGothic")

これだけです。「おまじない」ですね(笑)

今まであんまり気にしなかったけど、日本語入りのデータをプロットするときに日本語が出ないと困りますもんね。。 詳しいことは、こちらに書いておきました。

https://tom2rd.sakura.ne.jp/wp/2019/11/18/post-10619/

Google colabで直接開く方は、こちらから。。

Githubはこちらです。

Googlecolabutils/Matplot_pyplot_JP_example0.ipynb at master · tom2rd/Googlecolabutils
Google colab tips. Contribute to tom2rd/Googlecolabutils development by creating an account on GitHub.

フォントの指定にSeabornを使っているので、Seabornを使ってみたくなりました(笑) ので、ちょっと余計なサンプルがついています。

Seaborn モジュール

超簡単にいうと。。Matplotlib の中に、pyplotっていう便利な関数群があって、それをもっと便利に綺麗にかけるようにした仕組みがSeabornって感じです。

で。。日本語入りのデータを探そうと。。東京都オープンデータカタログから、データを取ってきました。

小平市のデータがよかったんですが、な~い ので(笑) 一番上にあった三鷹市の町別の人口を拝借してみました。

https://catalog.data.metro.tokyo.lg.jp/dataset/t132047d0000000006/resource/2b871eba-0723-4d90-9cb4-c9386c74b899

これが、また紛らわしいデータなのですが。。 (笑)

Seabornの良いところは、pandasのDataFrame形式で読み込んでおくと。。

sns.pairplot(df)

こういう関数一発で、それぞれの関係を、こんな感じでグラフ化してくれます。

ちゃんと日本語になってますね(笑)

で・・・

ヒストグラム見て。。こんなに偏ってる??? って疑問になるじゃないですか!(笑)

な~んか おかしい(笑)

大きい値が入っていそうですよね。。

で、よくよく調べてみると。。 途中に、小計というデータが入っていました(笑)

で。。それを取り除くと。

少しまともになりましたね。。 というか。。このサンプルは、実はデータのクレンジング(オカシイところを削除する)サンプルかも知れません(笑)

Googlecolabutils/Matplot_pyplot_JP_example0.ipynb at master · tom2rd/Googlecolabutils
Google colab tips. Contribute to tom2rd/Googlecolabutils development by creating an account on GitHub.

で。。

最終的に正しく入ったデータで書くと こんな感じです。

それでも、どこかの町だけ、人口突出してますね(笑)

どこだろう??って調べてみたら。。

下連雀3丁目 だけが 突出していますね。

あと、世帯数と総計 を 見てみたら。。

ほぼ1対2なんですね。。

ということは、2人家族がほとんどってことですね。。へーー

ということで。。。 日本語化されたseaborn、Matplotlib のpyplotの紹介でした。

日本語化されて、グラフで見れると、データ見やすいですね(笑)