TStarBots是《星际争霸2》游戏AI的代码实现。TStarBots使用了深度强化学习、模块化AI和动作空间分解等算法,以及大规模分布式强化学习平台。详细技术描述请参考Tencent AI Lab发布的预印本[1].我们期望其他研究人员或开发者能够在TStarBots的基础上继续研究或二次开发,与我们共同推进《星际争霸2》游戏AI研发的前沿、探索通用人工智能新的边界。
本次开源的代码包括三部分:
PySC2TencentExtension:这是Deepmind原版PySC2的一个扩展。增补的内容包括:1)暴露了game core中的raw interface 2)添加了TechTree Data.这部分的内容描述请参考[1]的3.1节
TStarBot1:这是一个基于动作空间扁平化建模和深度强化学习的AI.详细描述见[1]的3.2节。
TStarBot2:这是一个基于动作空间层级化建模和规则控制器的AI.详细描述见[1]的3.3节。
参考文献
[1] https://arxiv.org/pdf/1809.07193.pdf
领取专属 10元无门槛券
私享最新 技术干货