ChatGPTで自動分析
Being のAIもGoogle のBardも優秀で、画像を読み込んでこれ何?とかもできるようになってるし、Pythonでプログラム書いてといえば書いてくれますが。。OpenAIのChatGPT君に、Code interpriter という機能が付いて、また便利になりました。今までも、PluginでCoderPadっていうのがあって、そこでPython動かすとかできていましたが、CSVデータを読み込ませてそれを分析させて、その分析用のPythonプログラムを動かしながら検証していくなんてことができます。
Code interpriter
起動のさせかた。。まず、ChatGPTに課金しないと使えません。
ちなみに、1か月毎なので、使いたい時だけ$20払ってもいいかもです。僕はなんどか退会・入会を繰り返しています。1か月くらいつかわんな。。って思ったらすぐに退会しちゃうといいです。
同じように、名前の横の・・・を押して、Beta futuresをクリックして、Code interpriter をONすると、使えるようになります。
これで、使えるようになります。ちなみに、ほかのプラグインも使えるようにしておくといいですね。
GPT-4を選んで、Pluginを使う時と同様に、Code interpriter にチェックを入れておきます。そうするとファイルアップロード用の+ボタンも出てきます。
ファイルのアップロードは、+ボタンを押せば、ファイルをDialogが開き、ファイルを選択できます。
Plugin
WebPilotを使えるようにしておくと、Beingのように、最新のWeb情報をとらえに行ってくれます。
他の人はあまり使わないかもですが。。研究者向けには、ScholarAIは、文献調査で文献一覧つくるのに便利。。 CoderPadもPython環境を作ってくれてそちらで動作確認できます。WolframっていうのもあってMatlabが動いてくれます。高度な分析をされる方は、これの方が分析手法いろいろ使えます。
ちなみに、Tasty RecipesやTabelogのプラグインは。。普通の検索の方が使いやすいかも(笑)
分析してみますか?
ということで。。いよいよ Code interpriterでどんなことできるか?
小平と周辺地域の分析してみますかな?
小平市のオープンデータはかなり整備されてます(笑)まぁそれなりに。。少しは進歩しました。
まずは、このデータ8 住民基本台帳人口の推移(Excel 29KB)を読み込ませてみましょう。
ダウンロードしてきて、アップロードして、分析してください って書くと。。
Pythonで読み込んでくれます。Show workってところを押すと、pandasのdataframeで読み込んだのがわかります。
例によって。。エクセルのデータが、Pythonなどでは読みずらいですよね。それを整形しましょう。
年次のところに、平成5年度だけ 平成5年とあり。。それ以下も、全角文字で入っています。これを半角にしてもらいましょう。
これできれいになったみたいですね。
グラフを書く
年度 と 人口 世帯数 人口密度のグラフを書いてください って書くと、フォントがないので日本語だせませんってでてきます。フォントのファイルをアップロードすると、日本語で出してくれます。
なんかおかしなグラフですよね。。
これは、X軸が令和と平成の年度で書かれているからです。
それで、平成や令和を西暦にしてください。とか。。いろいろ注文を付けます。データをみながらやると、だんだんと。。データがきれいになっていきます。他のファイルなども読み込んで、年度でマージしてくださいとかもやってくれます。
それで、上のグラフは。。
人口密度がどんどん大きくなっていますね。 2012年に急に増えていますね。。
どうしてなのか? 聞いてみましょう。 ChatGPTもBeingもBardも教えてくれませんでした。
なぜか?市役所の人に聞いてみるかな?(笑)
Pythonのモジュールをインポートして使うなどもできるのでデータさえあれば。。いろいろ分析できます。
が。。
過去のデータは、
とかになっていて。。これ細かい市町村の、住宅着工数とか町毎のデータはないようですね。。
Pythonのコードも出てくるので、Jpyterlabや、VScodeに持ってくれば、少しPythonができる人だと、全部をChatGPT内でやるより。。やり方やサンプルプログラムをChatGPTに聞いて教えてもらい、それをグラフ化なりいろいろな分析なりする方がいいですね。
あと、9 町丁別人口(Excel 32.5KB)のデータみたいに、複雑な形になっている場合は、ChatGPTに言って無理やりにデータ読み込むよりも、Excelで整えてからやる方が早いです。
ちなみに、うまくいく時は、〇〇と××をクロス分析して、モデルを作ってみて! と書くと。。なんかそれらしい結果がでてきますよ。
いろいろやって試してみて、教えてください。
追加 もう少し高度に。。
PFASの多摩地区の血中濃度を、いろんなデータから地図上にプロットしてみました。BardもBeingもChatGPTも駆使しています。
自分でやってみてくださいね。
ヒント
BardはGoogleアカウントを英語にすると、ファイル読み込みができます。 Bardの方が、OCR的なことができます。 またそれをスプレッドシートに読み込めます。
Beingは、検索との相性がとてもよく、どこにデータがあるかを探すのが得意です。(例えば、浄水所と住所など。。)
これらを、スプレッドシート上でマージして整形するのは、Bardで行うといいです。(住所から緯度経度を探すのは、Google検索でGASで検索する方がいいですね)
そのシートを、ChatGPTで読み込ませて、緯度経度をもとにコンタープロットしてみました。
プロントのやり取りは、
Bardは。。
辛抱強く わかりやすいように、わかるまで。。命令しましょう
そこそこPythonのことも、データのこともわかっていないと分析できないのは、AIと一緒にやっても同じですね。
こういうのも、ちゃんとデータ化して、扱えるようにできそうですね。。