DQNな学習
によると、
・ V. Mnih et al., “Playing atari with deep reinforcement learning”
元論文
・ V. Mnih et al., “Human-level control through deep reinforcement learning”
Natureの元論文
が基本的なDQNの論文になるんですね。。
この方のアルゴリズムをPython Chainerで作って動かしている動画もリンクされています。
DQNでAtariのPingPongゲームをDQNで学習している。
こういうのが、個人でできるようになってきているんですねぇ。。 すごいです。
V. Mnih さんという英国人は、面白いですね。こういうところから、ビジネスにどんどんつなげて行って、Googleで今はもっとやつにたつようにと。。。
この記事の例のハッカーさんも、このアルゴリズム派なような気がする。。Behaviorからだけみているだけなので、中身はわかりませんが(笑)
ラジコンカーを動かすとすると・・・DQNな動画がある
上の機械学習(強化学習を使ったもの)を見ていると、自動運転系のシミュレーションの動画もたくさんあることが。。わかりますね。。
2014年 ニューラルネットワークと強化学習での自動車運転
これは単純に、衝突回避で、前方の障害物を避けるのを学習しているようですね。。 マウス的な発想です。
ステア操作について、は・・・
2010年の動画 ニューラルネットでステアリングとか。。
きっと、道全体を見ているわけではなくて・・・前方のセンシングデータから経路をたどるというライントレーサっぽいものですね。
それが・・・2016年だと、3Dになってる。。
って・・・ことは・・・
ラジコンカーレースのシミュレータはVRCだよね。。
VRCで、やってみたら、できるんじゃないの??(笑) ちなみに、VRCってこんなの。。
VRCまで行かなくても。。。Androidで結構ラジコンシミュレータ出てるし・・・
ドライブシミュレータでもいいのか??
ドライブシミュレータ もいっぱいあるし・・・
ROSだとgazeboでもできそうな感じですね。Arudipilotとの相性でいけば、こっちかな?
やっぱり、Gaming PCを買おうかな?(笑)
GTX980でいいのか???やっぱりPascalアーキテクチャのGTX 1080系か?
やっぱりNIVIDIAのボードに行きつく(笑)
コメントを残していただけるとありがたいです