DQNな学習
http://qiita.com/Ugo-Nama/items/08c6a5f6a571335972d5
によると、
・ V. Mnih et al., “Playing atari with deep reinforcement learning”
元論文
・ V. Mnih et al., “Human-level control through deep reinforcement learning”
Natureの元論文
が基本的なDQNの論文になるんですね。。
この方のアルゴリズムをPython Chainerで作って動かしている動画もリンクされています。
DQNでAtariのPingPongゲームをDQNで学習している。
こういうのが、個人でできるようになってきているんですねぇ。。 すごいです。
V. Mnih さんという英国人は、面白いですね。こういうところから、ビジネスにどんどんつなげて行って、Googleで今はもっとやつにたつようにと。。。
http://japanese.engadget.com/2016/09/14/10/
この記事の例のハッカーさんも、このアルゴリズム派なような気がする。。Behaviorからだけみているだけなので、中身はわかりませんが(笑)
ラジコンカーを動かすとすると・・・DQNな動画がある
上の機械学習(強化学習を使ったもの)を見ていると、自動運転系のシミュレーションの動画もたくさんあることが。。わかりますね。。
2014年 ニューラルネットワークと強化学習での自動車運転
これは単純に、衝突回避で、前方の障害物を避けるのを学習しているようですね。。 マウス的な発想です。
ステア操作について、は・・・
2010年の動画 ニューラルネットでステアリングとか。。
きっと、道全体を見ているわけではなくて・・・前方のセンシングデータから経路をたどるというライントレーサっぽいものですね。
それが・・・2016年だと、3Dになってる。。
って・・・ことは・・・
ラジコンカーレースのシミュレータはVRCだよね。。
VRCで、やってみたら、できるんじゃないの??(笑) ちなみに、VRCってこんなの。。
https://www.youtube.com/watch?v=KZr63Ie42iU
VRCまで行かなくても。。。Androidで結構ラジコンシミュレータ出てるし・・・
https://play.google.com/store/apps/details?id=com.qubyte.rcchampions&hl=ja
ドライブシミュレータでもいいのか??
ドライブシミュレータ もいっぱいあるし・・・
ROSだとgazeboでもできそうな感じですね。Arudipilotとの相性でいけば、こっちかな?
http://tom2rd.sakura.ne.jp/wp/2016/10/20/post-2143/
やっぱり、Gaming PCを買おうかな?(笑)
GTX980でいいのか???やっぱりPascalアーキテクチャのGTX 1080系か?
やっぱりNIVIDIAのボードに行きつく(笑)
コメントを残していただけるとありがたいです