首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

详解Facebook田渊栋NIPS2017论文:让大家都能做得起深度强化学习研究的ELF平台

Mini-RTS 是一个迷你的定制化即时战略游戏,它包含了所有星际游戏中的基本变化(战争迷雾,收集资源,建造部队,用部队攻击和防御等等)。...即时战略游戏的特点是极高而且一直在变化的行动空间(比如10个单位,每个单位有5种可能的选择,行为空间就是510)、微妙的游戏状况以及大幅度延时的回报。...控制单位、移动、攻击、特定技能、对其它单位的影响等等基础设定一应俱全,而且这个引擎设计了具有不同层次的指令集,只要改变可用的指令、可用的单位、特定情况下引发的单位操作三个要素,就可以构建出新的游戏。...这三个游戏都具有以下的特点: 足够复杂的游戏性。每个游戏中的单位都是以真实坐标移动的,具有体积和碰撞检测,它们的动作也是需要占用时间的。...RTS引擎是时间触发型的,在每一次触发到时候,游戏中的bot会根据观察到的信息做出决定、给单位下达命令。然后这些命令就被执行、游戏状态发生变化,游戏就继续执行。

1.3K80

网络游戏是如何实现对战的呢?本文告诉你

这些当时最为火热的局域网联机游戏主要分为两类:飞行射击类与桌游模拟类,这其中,尤其以龙与地下城题材的桌游模拟类游戏最为丰富。...那么,这部主打联机对战的 RTS 游戏是如何实现他的同步机制的呢?...FPS 游戏中的网络同步 传统的各类 RPG、RTS 游戏根据游戏本身的规则和性质都可以轻松划分出一个个回合来实现上述帧同步的同步模式,同时,早期游戏的局域网环境,也更加适合帧同步这种无中心化的网络组织方式...MOBA 网络游戏中的网络同步 显然,MOBA 游戏更接近于传统的 RPG 与 RTS 游戏,所以,他们大部分都采用了 LockStep 模式为主,C-S 模式结合的同步模式。...现代网络游戏中,你在进入游戏之前,往往要选择网络延迟最低的服务器集群来进行交互,即使你没有手动选择,游戏客户端往往也会通过检测结果自动选择相应的服务器集群,从而保证所有玩家都在相对最佳的网络环境中进行游戏

2.7K21
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Facebook田渊栋开源游戏平台ELF,简化版《星际争霸》完美测试人工智能

    ELF 可以让研究者们在不同的游戏环境中测试他们的算法,其中包括桌游、Atari 游戏(通过 Arcade Learning Environment),以及定制的即时战略游戏(RTS)。...当增加更多的核心之后,ELF 每核的帧率保持稳定。 ? Mini-RTS:实时策略游戏进行研究 ELF 平台包括一个名为 Mini-RTS 的实时策略引擎与环境。...此外,我们的平台在环境代理通信拓扑、强化学习方法选择、游戏参数调整等方面上是灵活的,而且可以承载现有的 C/C++游戏环境如 Arcade Learning Environment。...游戏中获得了胜利。...它在其他两种游戏中也能达到相似的水平。在游戏的 Replay 中,我们可以看到人工智能代理展示了有趣的策略。ELF 和它的强化学习平台将会开源。

    796110

    王者荣耀AI绝悟如何选英雄?腾讯AI Lab新研究揭秘

    抢中单位?「绝悟」在打王者荣耀时是如何选英雄的? 腾讯 AI Lab 开发的 AI 智能体「绝悟」已让王者峡谷不再只是人类召唤师的竞技场,而且这个 AI 战队在上月底进化成了「完全体」。...研究者在大热 MOBA 手游《王者荣耀》中检验了该方法,结果表明:相较于其它当前前沿的方法,JueWuDraft 的实用性和有效性都更胜一筹。...尽管如此,相比于复杂的实时策略游戏(RTS),这些游戏要简单得多,因为 RTS 游戏更能体现真实世界的本质。...因此,近来的研究者更加关注 RTS 游戏,比如《Dota 2》、《星际争霸》和《王者荣耀》。 RTS 游戏有一个子类别是多人在线战术竞技游戏(MOBA),这是当今最受欢迎的一类电子竞技游戏。...每位玩家都会控制单个游戏角色,通常称为「英雄」,并与其他队友协作攻击对方的英雄、小兵、炮塔和中立生物,同时保护己方的单位。

    77320

    网络连接中断的原因,终于找到了!

    不知道多少朋友玩过 DNF 这个游戏,这个我从小学玩到大学的 “破” 游戏,昨天竟然出手游了! 我都忘了自己曾几何时预约过这个手游通知,昨天给我发了条通知信息说游戏已开服。...这个概念在游戏中,尤其是 FPS 第一人称射击游戏和 RTS 实施策略游戏中尤为重要。因为延迟会导致操作反馈的滞后,玩家可能会感觉到游戏操作不流畅,甚至出现瞬间卡顿。 抖动:指数据包传输时间的变化。...带宽是指单位时间内可以传输的数据量,它很大程度上决定了网速的快慢。 带宽分为上行带宽和下行带宽。...这点其实很重要,建议选择离自己地理位置较近的服务器。我小时候不懂,家在江苏,非要去选个什么广东的游戏大区。 5)使用专线网络或游戏加速器。...原理就是让工具来帮我们选择更合适的服务器节点、并且优化数据的传输路径。但是这玩意我小时候打游戏的时候就不爱用,免费的没啥效果,收费的又搞不起。 6)调整路由器的 QoS 设置。

    59510

    王者荣耀AI绝悟如何选英雄?腾讯AI Lab新研究揭秘

    抢中单位?「绝悟」在打王者荣耀时是如何选英雄的? 腾讯 AI Lab 开发的 AI 智能体「绝悟」已让王者峡谷不再只是人类召唤师的竞技场,而且这个 AI 战队在上月底进化成了「完全体」。...研究者在大热 MOBA 手游《王者荣耀》中检验了该方法,结果表明:相较于其它当前前沿的方法,JueWuDraft 的实用性和有效性都更胜一筹。...尽管如此,相比于复杂的实时策略游戏(RTS),这些游戏要简单得多,因为 RTS 游戏更能体现真实世界的本质。...因此,近来的研究者更加关注 RTS 游戏,比如《Dota 2》、《星际争霸》和《王者荣耀》。 RTS 游戏有一个子类别是多人在线战术竞技游戏(MOBA),这是当今最受欢迎的一类电子竞技游戏。...每位玩家都会控制单个游戏角色,通常称为「英雄」,并与其他队友协作攻击对方的英雄、小兵、炮塔和中立生物,同时保护己方的单位。

    51510

    学界 | 学习顶级玩家Replay,人工智能学会了星际争霸的「大局观」

    经过训练的 AI 学会了人类玩家运营的部分技巧,并在对战中展现出了多种不同策略。 有关星际争霸系列游戏的人工智能研究层出不穷,因为这一即时战略游戏(RTS)的环境复杂,在同类游戏中,平衡性也做得最好。...神经网络配合 UAlbertaBot 对战游戏内建 AI 人族的胜率 Probablilistic 为遵循网络输出最高可能性的策略,Greedy 为总是选择输出值最大的可能策略,Random 为随机选择可能范围内的策略...在对战人族时 Probabilistic 和 Greedy 量种策略生产单位/升级时的选择。由表可见,Greedy 策略的选择相对单一,Probabilistic 策略的变化更多。...研究人员认为,虽然目前的方法并未达到业内最先进的结果,但这是一个让人工智能学会在 RTS 游戏中进行运营非常有希望成功的方向。...此外,这种方法不仅可以适用于星际争霸系列,也可以直接适用于其他 RTS 游戏。

    78760

    Dota之后,《王者荣耀》也被AI攻陷,势把人类顶级玩家拉下马

    19日,腾讯AI Lab团队在arXiv上发表文章,训练AI大战人类玩家,而此次所选择的游戏,正是火遍大江南北的手游——《王者荣耀》。...论文地址:https://arxiv.org/pdf/1812.07887.pdf 腾讯团队表示,游戏AI的下一个挑战是即时策略(RTS)游戏。...可通过主屏幕观察周围环境,还可以通过左上角迷你地图了解完整的地图情况,其中可观察的炮塔,小兵和英雄显示为缩略图。只有当他们是盟友的单位或与盟友单位相距一定距离内时才能观察到该单位。...在MOBA游戏中,经验丰富的人类玩家完全了解游戏的每个阶段,例如开局阶段,推线阶段,游戏中期和游戏后期阶段。在每个阶段中,玩家都会关注游戏地图,并根据英雄的位置做出相应的决定。...根据这一观察,我们将地面真实区域定义为玩家进行下一次攻击的区域。如图所示。 设s为包含多个帧的游戏中的一个会话,s-1表示s之前的会话。 s - 1是游戏中的第一个会话。让ts成为s的起始框架。

    54430

    Dota之后,《王者荣耀》也被AI攻陷,势把人类顶级玩家拉下马

    19日,腾讯AI Lab团队在arXiv上发表文章,训练AI大战人类玩家,而此次所选择的游戏,正是火遍大江南北的手游——《王者荣耀》。 ?...论文地址:https://arxiv.org/pdf/1812.07887.pdf 腾讯团队表示,游戏AI的下一个挑战是即时策略(RTS)游戏。...可通过主屏幕观察周围环境,还可以通过左上角迷你地图了解完整的地图情况,其中可观察的炮塔,小兵和英雄显示为缩略图。只有当他们是盟友的单位或与盟友单位相距一定距离内时才能观察到该单位。...在MOBA游戏中,经验丰富的人类玩家完全了解游戏的每个阶段,例如开局阶段,推线阶段,游戏中期和游戏后期阶段。在每个阶段中,玩家都会关注游戏地图,并根据英雄的位置做出相应的决定。...根据这一观察,我们将地面真实区域定义为玩家进行下一次攻击的区域。如图所示。 设s为包含多个帧的游戏中的一个会话,s-1表示s之前的会话。 s - 1是游戏中的第一个会话。让ts成为s的起始框架。

    60240

    人类玩 DOTA2 能赢,是因为 AI 是暴雪爸爸教的

    即时策略游戏:最适合训练 AI 的游戏 即时策略游戏(Real Time Strategy Games,简称 RTS)是策略游戏的一种,跟回合制游戏不同,这种游戏可以即时进行,玩家在游戏中通常扮演决策者...因此,RTS 游戏很适合用来训练 AI 在不确定性场景中的决策能力,检验 AI 的算法效率。 训练 AI ,从征服「星际争霸」开始 而在所有的 RTS 游戏中,「星际争霸」无疑是最佳选择。...而且还允许创造最多 400 个兵种单位,各类兵种拥有不同的属性,可以在游戏中创造出无数中可能,因此,AI 需要运行更多算法进行应对。...ORTS: 专为 AI 研究搭建的 RTS 对战平台 ORTS 全称为 Open Real Time Strategy,是一个开放 RTS API 的即时策略游戏平台。...第一场和第二场侧重于在复杂地形上的兵种单位管理; 第三场则采用视野全开的无迷雾区模式,但禁止使用高级兵种; 第四场为常规对抗,有迷雾也可以使用高级兵种; 这届竞赛取得巨大成功,总共有 26 个 AI 团队参赛

    68830

    响铃:吃鸡大战,垄断市场的焦虑和不安

    1 品类的垄断,才是玩家的最大损失 在MOBA游戏霸占游戏市场太久之后,从H1Z1开始红起来的“吃鸡”射击竞技游戏无疑给了市场玩家更多优质游戏选择,拿抄袭来作文章阻碍品类游戏的发展并不是明智的选择。...事实上,淘汰至最后一人(或小队)的生存玩法,最早应该追溯到《我的世界》游戏中的饥饿游戏MOD,而H1Z1更是先于《绝地求生》火了大半年。...“吃鸡”类游戏由《我的世界》雏形初现,由《H1Z1》经《绝地求生》达到顶峰,后又被《荒野行动》等搬上移动端丰富娱乐场景,从长远角度来看,网易的两款吃鸡游戏本质都是生存竞技射击类游戏进步的又一个节点产品,...而在操作方式上,由于射击游戏更亲和键盘鼠标,端游中的常规操作在移动环境中并不容易实现,手游吃鸡的操作一直是难题,网易吃鸡游戏中的左侧按键开火、拖拽视野、自动拾取和战斗UI设计等元素都有大量的创新痕迹。...一个品类的发展,本身就应该是所有游戏从业者共同去完善的,《沙丘魔堡2》《魔兽争霸》《星际争霸》共同铸就RTS繁荣,《DOTA》《DOTA2》《英雄联盟》共同完成电子竞技的职业化、公众化。

    61230

    《王者荣耀》2亿用户量的背后:产品定位、技术架构、网络方案等

    《王者荣耀》能够成为如今国内最成功的手游,其后方成熟的技术团队可以说是功不可没。这个曾经在端游时代主导搭建RTS游戏《霸三国》框架的技术团队,在转型做MOBA手游《王者荣耀》后为游戏提供了巨大的支持。...我能透露的数据是,现在王者后端的机器大概是4600多台机器,我们的容量也有一定的扩展,进程数目是4万多个。...3、《王者荣耀》的产品背景:原本是RTS端游《霸三国OL》 2012年,我们当时做端游游戏,是王者的前身。最开始是偏向RTS的游戏,后来我们把它改成端游的MOBA,后来做手机上面的MOBA即王者。...从2012年开始做RTS游戏到2013年,从多控制单位的RTS游戏 变成MOBA游戏,到2014年启动王者的预研,再到2015年2月份我们把很多的人力(大概100多号人)投入做王者开发,时间比较短。...,投递的选择和大区资源占比有直接关系,因为Android手Q在王者里是最大的一个区,它所占用的机器也是最多的。

    3.4K83

    DeforGAN:用GAN实现星际争霸开全图外挂!

    日前,韩国三星公司的研究人员在星际争霸游戏中,将预测战争迷雾背后的作战单位信息建模为了一个部分可观察马尔科夫决策过程,并使用基于 GAN 的方法实现了当前性能最佳的战争迷雾去雾算法。 ?...结果表明 DefogGAN 可以预测敌方建筑物和作战单位,准确率与职业玩家相当,并且比当前最佳的去雾模型的性能更好。 AlphaGo 的成功为人工智能在游戏中的应用(Game AI)带来了极大的关注。...通过深度强化学习训练的智能体可以在国际象棋、围棋和 Atari 等经典游戏中轻而易举地胜过人类。随着任务环境越来越复杂,实时战略游戏(RTS)成为了一种评估最先进的学习算法的方式。...本文使用星际争霸作为实验场景——这是一款 RTS 游戏,游戏中有三个均衡的种族供玩家选择,玩家要建立完全不同的游戏风格和战略。在发行逾二十年后,星际争霸依然是一款非常受欢迎的电子竞技游戏。...随机选择四组录像,给出每个模型预测的、去雾后的完全观察状态。例如,在录像 4 中,在部分可观察状态 x¯_t 的右下角看不到红色的敌方单位。

    1K10

    游密全球首发H5游戏通讯云,接入SDK兼容所有浏览器

    而随着配套技术服务成熟,H5游戏开原生态的日益发达,如今有越来越多的游戏开发者选择H5平台。...“蝴蝶互动”国内最优质的H5游戏开发商,其CEO凌海认为H5的市场前景依然非常明朗,当时选择做H5游戏,是因为他看到手游已经大热,页游高峰,端游有点下跌,而H5作为“手机页游”,一定会像PC页游一样蓬勃发展...因此选择接入第三方语音通讯SDK,才是明智之举。 游密科技CEO白宁表示,市场分布的多元化与开发技术实现的不断突破,正是为整个H5游戏行业的快速发展奠定了基础。...其中H5-IM部分,文字、表情、语音消息一应俱全,更有自定义消息给予开发者更多支持,轻松实现玩家在聊天系统中,将游戏中的对象(物品、装备、道具)发送给其他玩家,或者将包含指令内容的消息发送给其他玩家,让其通过点击该消息进行传送...游密的反垃圾系统(脏字过滤、反广告、禁言)一如既往的强大,全方位支持H5-IM系统,将游戏中发送的广告、诈骗等消息采取黑洞策略,有效过滤96%以上的游戏垃圾信息,大幅减少此类信息对玩家的骚扰,更好地协助运营人员净化游戏的社交环境

    2K40

    不服SOLO:腾讯绝悟AI击败王者荣耀顶尖职业玩家,论文入选AAAI,未来将开源

    基于腾讯天美工作室开发的热门 MOBA 类手游《王者荣耀》,腾讯 AI Lab 正努力探索强化学习技术在复杂环境中的应用潜力。...表 3:AI 与职业选手使用不同类型英雄比赛的结果 绝悟选择了每个人类玩家擅长的英雄进行了 1v1 的五局三胜对战,用到的英雄包括貂蝉、狄仁杰、露娜、韩信和花木兰。 ?...这篇研究就在探讨这种更复杂的 MOBA 1v1 游戏,其中 MOBA 1v1 游戏就是一种需要高度复杂的动作决策的 RTS 游戏。...以 MOBA 手游《王者荣耀》中的 1v1 游戏为例,其状态和所涉动作的数量级分别可达 10^600 和 10^18000,而围棋中相应的数字则为 10^170 和 10^360,参见下表 1。...除了玩家与对手的智能体,游戏中还有其它很多游戏单位,比如小兵和炮塔。这会给目标选择带来困难,因为这需要精细的决策序列和相应的动作执行。

    1.3K30

    你手机的电都去哪儿了?

    我制作了5张纯色图片,分别是:黑、红、绿、蓝、白,然后从全民飞机大战和雷霆战机上分别截取了排行榜的屏幕截图: ?...File/Memory: 下面是模拟手游的内存读写和文件读写操作,游戏中内存操作是比较频繁的,但是文件读写相比内存是要少的,特别是写文件,下面分别设计了两个模拟场景,并记录耗电情况。 ?...LBS: 虽然不少游戏中有LBS功能,一般用于查找附近的玩家,实际玩游戏过程中使用的并不频繁,甚至是比较少的,所以LBS这一块对手游的整体耗电影响很有限。...有策略的降低FPS,降低FPS可以减少单位时间内的渲染次数。可以考虑在游戏准备界面,排行榜等界面降低FPS,比如天天酷跑,在开始游戏前,FPS被限制为30,游戏开始之后FPS才为60。...在3G模式下,应避免频繁收发数据包,一方面精简数据包,减少了收发数据的总量;另一方面可以将多个数据包合并一次发送,也减少了收发数据的次数。

    2K30

    移动互联网成社交游戏第二春

    从《全民农场》名称便可知道这是一款微信游戏,微信游戏中心现存的21款游戏中,有8款为“全民”开头,6个是“天天”开头,还有3个“欢乐”开头。“全民”已经成为微信游戏的专属名称了。...此后微信游戏发展可谓顺风顺水,截止目前微信游戏中心已拥有20多款游戏。而另外两个移动游戏出口,应用宝和手机QQ还有多款别的游戏。...移动游戏红利:随着我叫MT、啪啪三国等现象级游戏的出现,手机游戏已经进入高速增长期。4G时代到来、手机性能提升、大屏手机兴起给多元的手机网络游戏提供了良好的基础。...腾讯从去年8月启动手机游戏平台之后,已经涵盖轻、中、重多层次游戏,同时选择了开放式的游戏平台道路,既有自行研发,也引入欧美、日韩的精品游戏,譬如《全民打怪兽》、《赤壁乱舞》。...不论是哪种层次的游戏,不论是RPG、休闲、射击还是卡牌游戏,均无法脱离账号体系和社交关系链,且越到后面,社交关系的挖掘将会越深,譬如真实好友RPG游戏、结合智能硬件的软硬游戏等等,社交关系正是腾讯的核心优势

    71250

    风靡全国,日活8000万,《王者荣耀》后台技术架构演进!

    这个曾经在端游时代主导搭建 RTS 游戏《霸三国》框架的技术团队,在转型做 MOBA 手游《王者荣耀》后为游戏提供了巨大的支持,但这个过程也并非一帆风顺。...这款产品最开始是偏向 RTS 的游戏,后来我们把它改成了端游 MOBA,再后来做成了手游 MOBA,即现在的《王者荣耀》。...从 2012 年开始做 RTS 游戏到 2013 年,从多控制单位的 RTS 游戏,变成 MOBA 游戏,到 2014 年启动手游 MOBA 的预研,再到 2015 年 2 月份我们把大量人力(大概100...还有一点,就是预留设计弹性,在最开始的 RTS 中,每个玩家最多可以操作 5-8 个单位进行对抗,到后来改成 MOBA 游戏,只能操作一个英雄,并且加入各种各样的场景,我们本身的技术框架并不需要做出颠覆性的改动...投递的选择和大区资源占比有直接关系。

    5.4K20

    Deepmind AI在《星际争霸2》血虐99.8%人类,登顶宗师段位

    新智元报道 来源:PC Gamers等 编辑:啸林 【新智元导读】虽然IBM一直在做与人类辩论的AI,Deepmind团队一直执着于创造在游戏中血虐人类玩家的AI。这是为什么?...RTS游戏中,电脑AI=人工智障? 对于大多数游戏玩家来说,游戏内置的电脑AI,似乎都是一个笑话,更应该被称为“人工智障”。...从星际争霸1到星际争霸2,这款RTS神作一直被列为世界电子竞技的核心项目之一。 ?...星际争霸中不存在最优策略,AI需要不断探索和拓展更新自己的战略知识。 操作空间巨大,需要同时操作上百个不同的单位,所以可能性的组合空间非常大。 游戏过程很长,需要长期规划。...最后在Alpha League中选择最不容易被利用的Agent,称之为“The nash of League”,去挑战人类。

    58910
    领券