東京公共交通オープンデータチャレンジ
ふと、このチャレンジのサイトが目に留まり。。
データセットがAPIで公開されている(登録必要)のを見て
https://ckan-tokyochallenge.odpt.org/dataset
もっと使えるのがないかな?って見てたら沢山でてきたので、ちょっとリンク集のように作っておきます。
まず、このサイトで紹介されていたリンク集
- 内閣官房IT総合戦略本部 : 政府データカタログサイト
http://www.data.go.jp/ - 政府統計の総合窓口(e-Stat)
http://www.e-stat.go.jp/api/ - 東京都 : 東京都オープンデータカタログサイト
http://opendata-portal.metro.tokyo.jp/www/index.html - 国土交通省 : 歩行移動支援サービスに関するデータサイト
https://www.hokoukukan.go.jp/top.html - 国土地理院 : パブリックタグ情報共有プラットフォーム
https://ucopendb.gsi.go.jp/ucode/field_test/index.html - 気象庁 : 気象データ高度利用ポータルサイト
http://www.data.jma.go.jp/developer/index.html - 文化庁 : Culture NIPPONに公開されている文化施設の情報を公開します
http://culture-nippon.go.jp/ja
1、2、3は、もういっぱいありすぎて探せないですね(笑)相互に入っているので、余計に分かりにくいです。
3は、東京都オープンデータカタログ直接見た方が良さそうです。道路工事とかの情報も載ってますが、かなりデータをたどらないと、何のデータか分からないものが多いですね(笑)
http://opendata-catalogue.metro.tokyo.jp/dataset
4がなかなか優れものかも知れません。
その中でも
・らくらくおでかけマップ (駅などのバリアフリー情報がのってます)
http://www.ecomo-rakuraku.jp/rakuraku/index/
全国の無縁LANのスポットが出てます。
東京都版は、
にありますね。
プログラムレスなスクレイピング
この中から、小平とか周辺だけのデータが上がってきたら、見えるようにするとかも面白いかも知れませんね。
スクレイピングと呼ばれる方法です。
https://www.slideshare.net/itonaoyuki/ss-36155151
これ、なかなか的を得ているように思います。いっぱいデータあるけど、探せないっていう現状と、それを使えないっていうことの方が問題になってきているのかもしれないですね。
でも、スクレイピングツールは、もうどれもやってないみたい。
他のものでフリーで使えるものを拾ってみました。
Octoparse
https://www.octoparse.com/
登録してみると、ダウンロードして、つかうWindowsのソフトウェアですね。一応フリーで使えます。自分のコンピュータからするのは、少し勇気がいるかもですけど(笑)
プログラミングせずにできるので、自分の情報収集にはいいかもしれませんね。また使ったらレポートします。
WP Scraper
WordPressにもPlugINで、スクレイピングツールがあるようです。入れてみたけど、単純にリンクをつくってくれるだけのようです。あんまり意味ないから消した。。
けど、固定されているサイトのURLの中身のリンク集を作るとかなら使えそうです。
PDFからXMLへ変換するツール
http://tabula.technology/
インストールして使うタイプ。表を選んでCSV,JSONなどに変換してくれます。クリップボードにコピーできるのは、結構便利ですね。
https://pdftables.com/
こちらはWebサービス。22ページまでは、無料です。ログインすると50ページまで無料だそうです。
スクレイピングはやっぱりプログラムレスは、有料なのね。。
って・・・ツールで使えるのってTablaだけだな(笑)
やっぱりこのあたりを読んでPythonでやった方が良さそうな雰囲気です。
https://takahiromiura.github.io/web_scraping.html
こういうCloud IDEで動かしたら怒られるのかな?w
https://www.pythonanywhere.com/
http://pythonfiddle.com/
コメントを残す