首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

一小时带你了解何谓强化学习

时间| 11月19日

6:30PM-8:00PM

地点| GB 220

“An Odyssey in Deep Reinforcement Learning”

深度强化学习速成

在本期workshop的前半段,Lunjun将为大家深入讲解作为人工智能领域如今最活跃的研究方向——“强化学习” 的入门知识。本次MIST101课程不仅囊括了RL的基础思想,也将介绍几种RL领域最新的方法,其中包括:价值迭代value iteration, 策略梯度policy gradients,“演员评判家”actor-critic,Q学习算法Q-learning,和探索策略exploration strategies。本期MIST101也将探索优化问题与信息论中的概念是如何在以上问题中得到应用。

让EngSci大神带大家从零开始学习强化学习!

演讲人介绍

Lunjun Zhang

第2年EngSci在读,机器智能学生团队Machine Intelligence Student Team项目主管。2018暑期在Vector Institute担任科研助理,在Jimmy Ba教授的指导下从事强化学习中的奖励设计(reward shaping)问题。Lunjun的主要兴趣为强化学习、优化和多智能体系统multi-agent systems。

MIST101介绍

MIST101是UTMIST开展的一项关于机器学习的介绍课程。主要侧重于对该领域的理论知识介绍和实践理解,并强调顶尖研究和行业应用。在第一期的MIST101中,我们的目标是介绍有关机器学习的基础知识,并展示在解决机器学习问题时的一般流程。

关注我们

facebook.com/UofT.mist

微信公众号:UTMIST

文字 / Ivy

排版 / Julia

校对 / Harvey

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181115G0N2S400?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券