你肯定听说过 Deepmind with AlphaGo Zero 和 OpenAI in Dota 2 取得的惊人成绩! 你难道不想知道他们是如何工作的吗?现在正是你我最终学会“深度强化学习”,并应用到已有项目的时机。
终极目标是使用这些多功能的技术,并应用他们到各种重要的真实世界问题中。Demis Hassabis
这个项目引导你完成从最基本的到高级的AlphaGo Zero深度强化学习算法。你可以发现按周组织的主题和建议学习资源。 同时,每周我会提供用Python实现的应用实例,帮助你更好地消化理论。
- 了解Python和PyTorch
- 机器学习
- 了解深度学习(MLP,CNN和RNN)
- Q-learning
- DQN
- AC2
- ES
- AlphaGo Zero
忘记过去的人,终将重蹈覆辙。 - George Santayana
-
马尔科夫决策过程 - RL by David Silver
马尔科夫决策过程定义强化学习问题
- 马尔科夫过程
- 马尔科夫决策过程
-
动态规划设计 - RL by David Silver
如何解决马尔科夫决策问题
- 策略迭代
- 价值迭代
-
无模型预测 - RL by David Silver
评估无模型马尔科夫决策过程的价值函数
- 蒙特卡罗学习
- 时间差分学习
- TD(λ)
-
无模型约束 - RL by David Silver
优化无模型卡尔科夫决策过程价值函数
- Ɛ贪婪策略迭代
- GLIE蒙特卡罗搜索
- SARSA
- 重要性采样
Q-learning解决冰冻湖问题. 在本练习中,你将学会使用SARSA或者Q-learning.
- 阅读该书的第3,4,5,6,7章节 Reinforcement Learning An Introduction - Sutton, Barto
📺 Deep Reinforcement Learning - UC Berkeley class by Levine, check here their site.
📺 Reinforcement Learning course - by David Silver, DeepMind. Great introductory lectures by Silver, a lead researcher on AlphaGo. They follow the book Reinforcement Learning by Sutton & Barto.
📓 Reinforcement Learning: An Introduction - by Sutton & Barto. The "Bible" of reinforcement learning. Here you can find the PDF draft of the second version.
📚 Awesome Reinforcement Learning. A curated list of resources dedicated to reinforcement learning