深度强化学习实验室
官网:http://www.neurondance.com/
论坛:http://deeprl.neurondance.com/
排版:OpenDeepRL
可直接跳转原文:
http://deeprl.neurondance.com/d/465-pettingzoogymagent
二、部分环境
# Using environments in PettingZoo is very similar to Gym, i.e. you initialize an environment via:
from pettingzoo.butterfly import pistonball_v4
env = pistonball_v4.env()
# Environments can be interacted with in a manner very similar to Gym:
env.reset()
for agent in env.agent_iter():
observation, reward, done, info = env.last()
action = policy(observation)
env.step(action)
一、简介 二、 MARL中API的状态 三、 API设计原则 四、 API 设计 五、 默认环境 六、 质量的改善 七、 总结
完整版请查看实验室论坛(也可点击http://www.deeprlhub.com/d/465-pettingzoogymagent):
http://deeprl.neurondance.com/d/465-pettingzoogymagent