强化学习系列知识的全部内容 - 阅读清单 - 腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

清单首页强化学习系列知识

精彩点评

轻点为此清单评分

0

暂无点评，欢迎发表观点

清单文章

1

强化学习（一）模型基础

2

强化学习（二）马尔科夫决策过程(MDP)

3

强化学习（三）用动态规划（DP）求解

4

强化学习（四）用蒙特卡罗法（MC）求解

5

强化学习（五）用时序差分法（TD）求解

6

强化学习（六）时序差分在线控制算法SARSA

7

强化学习（七）时序差分离线控制算法Q-Learning

8

强化学习（八）价值函数的近似表示与Deep Q-Learning

9

强化学习（九）Deep Q-Learning进阶之Nature DQN

10

强化学习（十）Double DQN (DDQN)

11

强化学习(十一) Prioritized Replay DQN

12

强化学习(十二) Dueling DQN

13

强化学习(十三) 策略梯度(Policy Gradient)

14

强化学习(十四) Actor-Critic

15

强化学习(十五) A3C

16

强化学习(十六) 深度确定性策略梯度(DDPG)

17

强化学习(十七) 基于模型的强化学习与Dyna算法框架

18

强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)

19

强化学习(十九) AlphaGo Zero强化学习原理

共 19 篇

分享清单