【Opendata】東京都オープンデータなど、近場のデータセットと、ツールのリンク集(PDF変換くらいかな?)【Tips】

東京公共交通オープンデータチャレンジ

ふと、このチャレンジのサイトが目に留まり。。

データセットがAPIで公開されている(登録必要)のを見て

https://ckan-tokyochallenge.odpt.org/dataset

もっと使えるのがないかな?って見てたら沢山でてきたので、ちょっとリンク集のように作っておきます。

まず、このサイトで紹介されていたリンク集

  1. 内閣官房IT総合戦略本部 : 政府データカタログサイト
    http://www.data.go.jp/
  2. 政府統計の総合窓口(e-Stat)
    http://www.e-stat.go.jp/api/
  3. 東京都 : 東京都オープンデータカタログサイト
    http://opendata-portal.metro.tokyo.jp/www/index.html
  4. 国土交通省 : 歩行移動支援サービスに関するデータサイト
    https://www.hokoukukan.go.jp/top.html
  5. 国土地理院 : パブリックタグ情報共有プラットフォーム
    https://ucopendb.gsi.go.jp/ucode/field_test/index.html
  6. 気象庁 : 気象データ高度利用ポータルサイト
    http://www.data.jma.go.jp/developer/index.html
  7. 文化庁 : Culture NIPPONに公開されている文化施設の情報を公開します
    http://culture-nippon.go.jp/ja

1、2、3は、もういっぱいありすぎて探せないですね(笑)相互に入っているので、余計に分かりにくいです。

3は、東京都オープンデータカタログ直接見た方が良さそうです。道路工事とかの情報も載ってますが、かなりデータをたどらないと、何のデータか分からないものが多いですね(笑)

http://opendata-catalogue.metro.tokyo.jp/dataset

4がなかなか優れものかも知れません。

その中でも

アプリケーション開発に役立つデータサイト

・らくらくおでかけマップ (駅などのバリアフリー情報がのってます)

http://www.ecomo-rakuraku.jp/rakuraku/index/

無料公衆無線LANスポット

全国の無縁LANのスポットが出てます。

東京都版は、

FREE Wi-Fi & TOKYO スポット情報

【東京都産業労働局】 外国人旅行者等が多く訪れる都立施設などにおいて無料で利用できる公衆無線LAN(Wi-Fi)サービス「FREE Wi-Fi & TOKYO」のスポット一覧です。

にありますね。

プログラムレスなスクレイピング

この中から、小平とか周辺だけのデータが上がってきたら、見えるようにするとかも面白いかも知れませんね。

スクレイピングと呼ばれる方法です。

https://www.slideshare.net/itonaoyuki/ss-36155151

これ、なかなか的を得ているように思います。いっぱいデータあるけど、探せないっていう現状と、それを使えないっていうことの方が問題になってきているのかもしれないですね。

でも、スクレイピングツールは、もうどれもやってないみたい。

他のものでフリーで使えるものを拾ってみました。

Octoparse

https://www.octoparse.com/

登録してみると、ダウンロードして、つかうWindowsのソフトウェアですね。一応フリーで使えます。自分のコンピュータからするのは、少し勇気がいるかもですけど(笑)

プログラミングせずにできるので、自分の情報収集にはいいかもしれませんね。また使ったらレポートします。

WP Scraper

WP Scraper

WordPressにもPlugINで、スクレイピングツールがあるようです。入れてみたけど、単純にリンクをつくってくれるだけのようです。あんまり意味ないから消した。。

けど、固定されているサイトのURLの中身のリンク集を作るとかなら使えそうです。

PDFからXMLへ変換するツール

http://tabula.technology/

インストールして使うタイプ。表を選んでCSV,JSONなどに変換してくれます。クリップボードにコピーできるのは、結構便利ですね。

https://pdftables.com/

こちらはWebサービス。22ページまでは、無料です。ログインすると50ページまで無料だそうです。

スクレイピングはやっぱりプログラムレスは、有料なのね。。

って・・・ツールで使えるのってTablaだけだな(笑)

やっぱりこのあたりを読んでPythonでやった方が良さそうな雰囲気です。

https://takahiromiura.github.io/web_scraping.html

こういうCloud IDEで動かしたら怒られるのかな?w

https://www.pythonanywhere.com/

http://pythonfiddle.com/

 


投稿日

カテゴリー:

,

投稿者:

タグ:

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

This site uses Akismet to reduce spam. Learn how your comment data is processed.

PHP Code Snippets Powered By : XYZScripts.com