【ChatGPT】コードインタプリタ便利ですね。データ分析とか頼んでみると一発【AI】

ChatGPTで自動分析

Being のAIもGoogle のBardも優秀で、画像を読み込んでこれ何?とかもできるようになってるし、Pythonでプログラム書いてといえば書いてくれますが。。OpenAIのChatGPT君に、Code interpriter という機能が付いて、また便利になりました。今までも、PluginでCoderPadっていうのがあって、そこでPython動かすとかできていましたが、CSVデータを読み込ませてそれを分析させて、その分析用のPythonプログラムを動かしながら検証していくなんてことができます。

https://chat.openai.com/

Code interpriter

起動のさせかた。。まず、ChatGPTに課金しないと使えません

ちなみに、1か月毎なので、使いたい時だけ$20払ってもいいかもです。僕はなんどか退会・入会を繰り返しています。1か月くらいつかわんな。。って思ったらすぐに退会しちゃうといいです。

同じように、名前の横の・・・を押して、Beta futuresをクリックして、Code interpriter をONすると、使えるようになります。

これで、使えるようになります。ちなみに、ほかのプラグインも使えるようにしておくといいですね。

GPT-4を選んで、Pluginを使う時と同様に、Code interpriter にチェックを入れておきます。そうするとファイルアップロード用の+ボタンも出てきます。

ファイルのアップロードは、+ボタンを押せば、ファイルをDialogが開き、ファイルを選択できます。

Plugin

WebPilotを使えるようにしておくと、Beingのように、最新のWeb情報をとらえに行ってくれます。

他の人はあまり使わないかもですが。。研究者向けには、ScholarAIは、文献調査で文献一覧つくるのに便利。。 CoderPadもPython環境を作ってくれてそちらで動作確認できます。WolframっていうのもあってMatlabが動いてくれます。高度な分析をされる方は、これの方が分析手法いろいろ使えます。

ちなみに、Tasty RecipesやTabelogのプラグインは。。普通の検索の方が使いやすいかも(笑)

分析してみますか?

ということで。。いよいよ Code interpriterでどんなことできるか?

小平と周辺地域の分析してみますかな?

小平市のオープンデータはかなり整備されてます(笑)まぁそれなりに。。少しは進歩しました。

オープンデータ 人口|東京都小平市公式ホームページ
8 住民基本台帳人口の推移9 町丁別人口10 月別人口世帯数の推移11 人口動態12 年齢(5歳階級)別人口13 外国人住民数14 国勢調査人口の推移15 都道府県別転出入人口16 他区市町村からの流入人口17 他区市町村への流出人口18 町丁別一般世帯数・一般世帯人員19 年齢別昼間人口20 昼間人口の推移21 東京...

まずは、このデータ8 住民基本台帳人口の推移(Excel 29KB)を読み込ませてみましょう。

ダウンロードしてきて、アップロードして、分析してください って書くと。。

Pythonで読み込んでくれます。Show workってところを押すと、pandasのdataframeで読み込んだのがわかります。

例によって。。エクセルのデータが、Pythonなどでは読みずらいですよね。それを整形しましょう。

年次のところに、平成5年度だけ  平成5年とあり。。それ以下も、全角文字で入っています。これを半角にしてもらいましょう。

これできれいになったみたいですね。

グラフを書く

年度 と 人口 世帯数 人口密度のグラフを書いてください って書くと、フォントがないので日本語だせませんってでてきます。フォントのファイルをアップロードすると、日本語で出してくれます。

なんかおかしなグラフですよね。。

これは、X軸が令和と平成の年度で書かれているからです。

それで、平成や令和を西暦にしてください。とか。。いろいろ注文を付けます。データをみながらやると、だんだんと。。データがきれいになっていきます。他のファイルなども読み込んで、年度でマージしてくださいとかもやってくれます。

それで、上のグラフは。。

人口密度がどんどん大きくなっていますね。 2012年に急に増えていますね。。

どうしてなのか? 聞いてみましょう。 ChatGPTもBeingもBardも教えてくれませんでした。

なぜか?市役所の人に聞いてみるかな?(笑)

Pythonのモジュールをインポートして使うなどもできるのでデータさえあれば。。いろいろ分析できます。

が。。

過去のデータは、

統計ダッシュボード - データ検索画面

とかになっていて。。これ細かい市町村の、住宅着工数とか町毎のデータはないようですね。。

Pythonのコードも出てくるので、Jpyterlabや、VScodeに持ってくれば、少しPythonができる人だと、全部をChatGPT内でやるより。。やり方やサンプルプログラムをChatGPTに聞いて教えてもらい、それをグラフ化なりいろいろな分析なりする方がいいですね。

あと、9 町丁別人口(Excel 32.5KB)のデータみたいに、複雑な形になっている場合は、ChatGPTに言って無理やりにデータ読み込むよりも、Excelで整えてからやる方が早いです。

ちなみに、うまくいく時は、〇〇と××をクロス分析して、モデルを作ってみて! と書くと。。なんかそれらしい結果がでてきますよ。

いろいろやって試してみて、教えてください。

追加 もう少し高度に。。

PFASの多摩地区の血中濃度を、いろんなデータから地図上にプロットしてみました。BardもBeingもChatGPTも駆使しています。

自分でやってみてくださいね。

ヒント

元のデータは、これこれこれを使っています。

BardはGoogleアカウントを英語にすると、ファイル読み込みができます。 Bardの方が、OCR的なことができます。 またそれをスプレッドシートに読み込めます。

Beingは、検索との相性がとてもよく、どこにデータがあるかを探すのが得意です。(例えば、浄水所と住所など。。)

これらを、スプレッドシート上でマージして整形するのは、Bardで行うといいです。(住所から緯度経度を探すのは、Google検索でGASで検索する方がいいですね)

そのシートを、ChatGPTで読み込ませて、緯度経度をもとにコンタープロットしてみました。

プロントのやり取りは、

Bardは。。

ChatGPT はこちら です。かなり四苦八苦しているけど。。できちゃいますね。ひとつ前にできてたことが、少したつとできなくなったりしてて。。笑えちゃいますが。。

辛抱強く わかりやすいように、わかるまで。。命令しましょう

そこそこPythonのことも、データのこともわかっていないと分析できないのは、AIと一緒にやっても同じですね。

こういうのも、ちゃんとデータ化して、扱えるようにできそうですね。。

クリックして000131056.pdfにアクセス