Acrobot02

デモプログラム

SDNNプログラム

入力操作
KEY:"s"SDNNの学習開始
KEY:"r"RBFNの学習開始
左クリック早送り


簡単な説明

Acrobot課題において強化学習を行って適切な行動を獲得するデモです.関数近似器として,選択的不感化法を適用した層状ニューラルネット(SDNN)を用いています.

また比較のために,関数近似器として,放射状基底関数ネットワーク(RBFN)を用いたモードも用意しています.切り替えはキー操作で行えます.

SDNNは,第一リンクが早く振りあがる過程が1試行目から見られます.10試行程度学習を重ねると1試行当たり15秒程度でゴールに到達するようになります.このように,関数近似器にSDNNを用いると学習効率が上がります.この結果は,SDNNの非常に高い関数近似能力と関係があるのですが,詳しい解析はこれからです.