- 第一部分基于David Silver的强化学习课程:https://www.youtube.com/watch?v=2pWv7GOvuf0&list=PL7-jPKtc4r78-wCZcQn5IqyuWhBZ8fOxT在优酷和B站上都有对应的视频以及它们的中文翻译版本。
- 另一部分是教材Reinforcement Learning: An Introduction:http://incompleteideas.net/sutton/book/bookdraft2017june.pdf
- 练习部分基于dennybritz 的强化学习相关作业:https://github.com/dennybritz/reinforcement-learning 实现主要是基于python、OpenAI的gym以及tensroflow。