前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >DreamerV3 接入Maze Env OK了

DreamerV3 接入Maze Env OK了

作者头像
CreateAMind
发布2023-09-01 08:23:22
2130
发布2023-09-01 08:23:22
举报
文章被收录于专栏:CreateAMind

https://github.com/NM512/dreamerv3-torch/issues/18

参考 DeepMind Dreamer 在这个任务上栽了 这个任务考验AI记忆能力的泛化

欢迎改进提升AI的记忆能力;

{"step": 601000, "dataset_size": 300500.0, "train_return": 6.0, "train_length": 500.0, "train_episodes": 601.0}

{"step": 704000, "dataset_size": 352000.0, "train_return": 6.0, "train_length": 500.0, "train_episodes": 704.0}

{"step": 454000, "dataset_size": 227000.0, "train_return": 6.0, "train_length": 500.0, "train_episodes": 454.0}

{"step": 528000, "dataset_size": 264000.0, "train_return": 6.0, "train_length": 500.0, "train_episodes": 528.0}

{"step": 545000, "eval_return": 2.9, "eval_length": 500.0, "eval_episodes": 10.0}

{"step": 555000, "dataset_size": 277500.0, "train_return": 6.0, "train_length": 500.0, "train_episodes": 555.0}

{"step": 581000, "dataset_size": 290500.0, "train_return": 6.0, "train_length": 500.0, "train_episodes": 581.0}

{"step": 608000, "dataset_size": 304000.0, "train_return": 6.0, "train_length": 500.0, "train_episodes": 608.0}

{"step": 616000, "dataset_size": 308000.0, "train_return": 6.0, "train_length": 500.0, "train_episodes": 616.0}

{"step": 649000, "dataset_size": 324500.0, "train_return": 6.0, "train_length": 500.0, "train_episodes": 649.0}

{"step": 693000, "dataset_size": 346500.0, "train_return": 6.0, "train_length": 500.0, "train_episodes": 693.0}

torch版本效果对比:

相关推荐:

code:通过进化、可塑性和 元 元学习 获得认知能力(4个时间维度的学习迭代)

代码:Learning to Learn and Forget (华为)

神经科学的深度学习框

代码:一个epoch打天下:深度Hebbian BP (华为实验室) 抗攻击

嵌套自我:产前发育中的自组织和共享马尔可夫毯

在突触学习和计算目标之间建立精确关系的框架

大脑中复杂适应动力学的神经调节控制

DeepMind Dreamer 系列为什么效果这么好

脑启发的ANN学习机制综述

DeepMind-代码:元学习认知模型 Meta-Learned Models of Cognition

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-06-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CreateAMind 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档