据站长之家 10 月 21 日报道,英伟达最新 AI AgentEureka 使用 GPT-4 生成奖励函数,教会机器人完成多项复杂任务,包括转笔、打开抽屉、抛球等,表现超越人类专家。
Eureka 采用混合梯度架构,结合无梯度的情境学习和强化学习,通过上下文来实现人类水平的奖励算法设计,大幅提升机器人性能。这项研究受到广泛关注,开源项目可在机器人领域应用,尤其在处理复杂任务和高维电机控制方面表现出色,甚至有时与人类策略负相关。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货