时间| 11月19日
6:30PM-8:00PM
地点| GB 220
“An Odyssey in Deep Reinforcement Learning”
深度强化学习速成
在本期workshop的前半段,Lunjun将为大家深入讲解作为人工智能领域如今最活跃的研究方向——“强化学习” 的入门知识。本次MIST101课程不仅囊括了RL的基础思想,也将介绍几种RL领域最新的方法,其中包括:价值迭代value iteration, 策略梯度policy gradients,“演员评判家”actor-critic,Q学习算法Q-learning,和探索策略exploration strategies。本期MIST101也将探索优化问题与信息论中的概念是如何在以上问题中得到应用。
让EngSci大神带大家从零开始学习强化学习!
演讲人介绍
Lunjun Zhang
第2年EngSci在读,机器智能学生团队Machine Intelligence Student Team项目主管。2018暑期在Vector Institute担任科研助理,在Jimmy Ba教授的指导下从事强化学习中的奖励设计(reward shaping)问题。Lunjun的主要兴趣为强化学习、优化和多智能体系统multi-agent systems。
MIST101介绍
MIST101是UTMIST开展的一项关于机器学习的介绍课程。主要侧重于对该领域的理论知识介绍和实践理解,并强调顶尖研究和行业应用。在第一期的MIST101中,我们的目标是介绍有关机器学习的基础知识,并展示在解决机器学习问题时的一般流程。
关注我们
facebook.com/UofT.mist
微信公众号:UTMIST
文字 / Ivy
排版 / Julia
校对 / Harvey
领取专属 10元无门槛券
私享最新 技术干货