首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

学界 | 斯坦福大学&DeepMind联合提出机器人控制新方法,RL+IL端到端地学习视觉运动策略

选自arXiv 作者:朱玉可等 机器之心编译 参与:路雪、思源 近日,来自斯坦福大学&DeepMind 的研究者提出一种学习机器人深度视觉运动策略的新方法,它结合强化学习和模仿学习来实现高效的强化学习智能体,该方法可解决大量视觉运动任务。实验证明该智能体性能显著优于仅使用强化学习或模仿学习训练出的智能体。 近期深度强化学习在多个领域取得了很好的表现,如视频游戏 [29] 和围棋 [46]。对于机器人,RL 结合强大的函数逼近器(如神经网络)可提供设计复杂控制器的通用框架,而这种控制器很难靠人力搭建。基于强化

05

295页博士论文探索强化学习抽象理论,获AAAI/ACM SIGAI博士论文奖提名

机器之心报道 机器之心编辑部 除了论文本身超有技术含量之外,文中使用的图表也非常美观漂亮。 作为人工智能里最受关注的领域之一,强化学习的热度一直居高不下,在游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用。但是,强化学习的学习难度也同样不低。 强化学习定义了学习仅通过行动和观察做出好的决策的智能体所面临的问题。要成为有效的问题解决者,这些智能体必须有效地探索广阔的世界,从延迟的反馈中获得credit,并归纳出新的经验,同时利用有限的数据、计算资源和感知带宽。 强化学习问题。 抽象(abstractio

05

「反卷斗士」许华哲:以热爱为名,用深度强化学习打造一个「机器厨子」

十年前,他以本科生的身份走入清华电子系;十年后,他将以一名教师的身份重回清华,在叉院开启新的篇章,传递知识,探索真理。 作者 | 李梅 编辑 | 陈彩娴 想象一下: 在未来的某一天,你,一个996的「社畜」,或「上班狗」,辛苦一天回到家,瘫倒在沙发上。当你抬头一看,你的机器人朋友正在厨房为你做晚饭——它的双手敏捷灵活,在油盐酱醋与锅碗瓢盆之间,一顿优雅操作,不久便有阵阵香气扑鼻而来。它把晚餐端到餐桌上,对你微微一笑:「开饭啦!」然后转身拿起你换下的衣物走向洗衣机...... 这不是一篇小学生的科幻小作文,而

02
领券