强化学习系列知识
精彩点评
清单文章
19
加入清单架
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
清单首页
强化学习系列知识
强化学习系列知识
19 篇
刘建平Pinard
·唯品会资深开发工程师
创建
暂无简介
0.0
1.3K人在读
举报
精彩点评
清单文章
19
精彩点评
轻点为此清单评分
0
提交
暂无点评,欢迎发表观点
清单文章
1
强化学习(一)模型基础
2
强化学习(二)马尔科夫决策过程(MDP)
3
强化学习(三)用动态规划(DP)求解
4
强化学习(四)用蒙特卡罗法(MC)求解
5
强化学习(五)用时序差分法(TD)求解
6
强化学习(六)时序差分在线控制算法SARSA
7
强化学习(七)时序差分离线控制算法Q-Learning
8
强化学习(八)价值函数的近似表示与Deep Q-Learning
9
强化学习(九)Deep Q-Learning进阶之Nature DQN
10
强化学习(十)Double DQN (DDQN)
11
强化学习(十一) Prioritized Replay DQN
12
强化学习(十二) Dueling DQN
13
强化学习(十三) 策略梯度(Policy Gradient)
14
强化学习(十四) Actor-Critic
15
强化学习(十五) A3C
16
强化学习(十六) 深度确定性策略梯度(DDPG)
17
强化学习(十七) 基于模型的强化学习与Dyna算法框架
18
强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)
19
强化学习(十九) AlphaGo Zero强化学习原理
共 19 篇
加入清单架
分享清单
领券