arXiv上的一篇介绍强化学习综述的文章,分享给大家。点击文末广告支持一下社区发展,本论文的下载地址:https://arxiv.org/pdf/1810.06339.pdf。或者后台回复"深度强化学习",获取百度网盘下载地址。
本论文主要分20个小的部分介绍:
主要概述人工智能、机器学习、深度学习、强化学习等,其中,强化学习部分介绍了问题的设置,价值函数,Exploration&Exploitation和动态规划。
本部分主要介绍深度Q-Learning、分布式价值函数、常见的价值函数。
本部分介绍Policy Gradient 和A3C相关内容
本部分介绍激励、模型和Exploration和Exploitation相关内容
本部分介绍知识和推理相关的内容
本部分介绍 无监督学习和不同结构的RL,包括层次的RL,多个Agent的RL,关系型的RL
本部分介绍自主学习相关的内容
本部分介绍强化学习的应用,包括:游戏、机器人、自然语言处理、计算机视觉、金融与企业管理、医疗、教育、能源等领域。