前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Colossal-AI发布新的深度学习辅助框架,半小时即可完成ViT-Base/32预训练

Colossal-AI发布新的深度学习辅助框架,半小时即可完成ViT-Base/32预训练

作者头像
deephub
发布于 2021-11-23 08:27:11
发布于 2021-11-23 08:27:11
1.1K0
举报
文章被收录于专栏:DeepHub IMBADeepHub IMBA

点击上方“Deephub Imba”,关注公众号,好文章不错过 !

从头开始预训练计算机视觉领域最热门的 AI 模型 Vision Transformer (ViT) 需要多长时间?Colossal-AI系统最新给出的答案是半小时!

近年来,随着AI性能的不断提升,AI模型参数的数量也呈现爆发式增长,从AlexNet、ResNet到BERT、GPT、MoE……,AI模型的参数量级不断刷新,现已超过万亿 ,这使得训练成本急剧上升。仅仅训练2020年发布的千亿参数GPT-3,即便是用一块最先进的英伟达A100 GPU进行训练,也需要等待100多年。显然,如何加速AI训练过程已经成为AI行业最大的痛点之一。

加速AI模型训练的一种常见方法是借助数据并行性来实现大批量训练,即通过增加批量大小,从而减少迭代次数,最终实现训练时间的显着减少。但是由于泛化差距,大批量训练通常会导致测试集上的收敛困难和性能下降。

因此,越来越多的科技巨头选择使用高性能计算技术,借助谷歌的 TPU Pod 和英伟达的 SuperPOD 等超级计算机集群,使用数百甚至数千个最好的处理器来并行加速计算任务。

然而,即使是价值数亿美元的超级计算机,也面临着当硬件堆栈达到一定数量时,计算效率无法进一步提高,浪费大量计算资源的瓶颈。此外,分布式并行编程通常需要与计算机系统和架构相关的专业知识,这进一步增加了前沿人工智能模型的训练成本。

在 ImageNet-1K 数据集(128 万张图像)上,ViT 的预训练需要使用整个数据集 300 次,使用一个批处理大小为 128 的 NVIDIA A100 GPU 预训练 ViT-Base/32 大约需要三天时间 .

使用 Colossal-AI 提供的大批量优化器 LAMB,可以成功克服大批量优化的困难,通过 32K 批量大小的数据并行快速将训练过程扩展到 200 个 A100 GPU,只需 0.61 小时即可完成 ViT-Base/32 训练并保持准确性。对于更复杂的ViT-Base/16 和 ViT-Large/32,Colossal-AI 也分别只需 1.87 小时和 1.30 小时即可完成。

目前主流的张量并行方案,如微软的DeepSpeed和英伟达的Megatron,都是一维张量并行,这意味着每个处理器都需要与其他所有处理器进行通信。但是,处理器之间的通信,尤其是多机跨节点通信,不仅会严重降低运行速度,占用处理器大量额外内存,而且能耗成本非常高。针对这个痛点,Colossal-AI 提出使用多维张量并行:2/2.5/3 维的张量并行。Colossal-AI还完全兼容现有的数据并行、流水线并行、序列并行等并行模式,共同构成了Colossal-AI的“六维并行”,远超微软和英伟达的三维并行,相关技术可以轻松扩展到推理加速领域。

Colossal-AI作为深度学习框架的核心,将“系统优化”与“上层框架”和“下层硬件”解耦,为多维并行、大批量优化器、零等前沿技术的实现提供了便捷的实现。以即插即用的方式卸载冗余内存。易于扩展和使用,只需要少量的代码修改,防止用户学习复杂的分布式系统知识。对于GPU等处理器来说,使用密集集群的平均算力成本会比分散使用低很多,这样不仅可以节省训练时间,还可以大大降低算力成本。

Colossal-AI 仍处于 beta 测试阶段,在不久的将来会发布更多惊人的结果。

Paper Address: https://arxiv.org/abs/2110.14883

Project Address: https://github.com/hpcaitech/ColossalAI

Document Address: https://www.colossalai.org/

作者:HPC-AI Tech

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-11-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DeepHub IMBA 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
利物浦用DeepMind的AI制定战术已有三年了
足球界最炙手可热的年轻教练既不是勒沃库森的阿隆索、兰斯的斯蒂尔,也不是博洛尼亚的莫塔,它可能是个 AI,来自谷歌 DeepMind。
机器之心
2024/03/26
1550
利物浦用DeepMind的AI制定战术已有三年了
要抢足球教练饭碗!切尔西未来或将用上AI教练
如果你看过电影《点球成金》,一定会对其中主角用数学方法改造球队印象深刻。如果足球未来也发展成高度数据化,甚至用AI代替人类执教,会不会少了一份激情?
量子位
2018/12/14
4510
要抢足球教练饭碗!切尔西未来或将用上AI教练
为里皮献策:国足再进一步,试试人工智能 | 附机器人世界杯集锦
唐旭、问耕 发自 凹非寺 量子位·QbitAI 报道 一场有着多重意义的比赛昨晚结束,国足坐镇长沙击败韩国队。 “天亮了”,赛后李毅大帝在朋友圈和微博上说。而朋友圈和微博也被国足刷爆。 赛后里皮说:“
量子位
2018/03/22
7120
为里皮献策:国足再进一步,试试人工智能 | 附机器人世界杯集锦
AI 成足球比赛「关键先生」:DeepMind 发布 TacticAI,战术布局实用性高达 90%
谷歌 DeepMind 与利物浦足球俱乐部联合推出 TacticAI,通过使用几何深度学习方法,借助预测与生成模型,为专业人士提供战术层面的见解。
HyperAI超神经
2024/03/29
8050
AI 成足球比赛「关键先生」:DeepMind 发布 TacticAI,战术布局实用性高达 90%
腾讯AI Lab绝悟团队夺冠Kaggle足球AI竞赛
Google Research 与英超曼城俱乐部在 Kaggle 平台上联合举办的 11v11 足球 AI 竞赛 Google Football 近日宣布最终结果:腾讯 AI Lab 绝悟 WeKick 版本(下称绝悟)以 1785.8 的分数获得冠军,且相比于其它队伍优势非常明显。
CV君
2021/01/05
1.1K0
腾讯AI Lab绝悟团队夺冠Kaggle足球AI竞赛
太硬核!用大数据技术预测足球胜率
点个关注👆跟腾讯工程师学技术 引言| 足球作为世界第一运动,充满了速度和力量的结果,团队与谋略的对抗。人们也说,足球是圆的,恰恰也表明了足球比赛的不可预知性,一切结果都皆有可能。强如巴萨,也有可能被联赛副班长逆转,弱如第三世界的朝鲜队也可闯进世界杯八强。天气、场地、球星、战术、伤病、裁判,每一个因素都可能会影响一场比赛的结果。有言道,在足球比赛里,不到最后一刻,你永远不知道事情的结果。对于足彩爱好者来说,不仅在欣赏足球荡气回肠、悬念丛生的魅力,更是在与博彩公司进行一场心理与策略的博弈(其实是为了投注赚钱)
腾讯云开发者
2022/12/05
6K0
太硬核!用大数据技术预测足球胜率
AI足球教练上岗利物浦,射门机会提高13%!来自DeepMind,网友:这不公平
像是进攻方把球传给谁更容易创造射门机会,防守方如何调整布阵……AI轻松设计出的高效战术与真实战术难以区分,并且人类专家在90%的情况下青睐AI的建议!
量子位
2024/03/21
1600
AI足球教练上岗利物浦,射门机会提高13%!来自DeepMind,网友:这不公平
腾讯AI足球队夺冠Kaggle竞赛,绝悟强化学习方案迁移至足球队
12月30日,腾讯宣布其人工智能球队摘得首届谷歌足球Kaggle竞赛冠军。该冠军球队来自腾讯AI Lab研发的绝悟WeKick版本,凭借1785.8的总分在与全球顶级技术团队的竞技中以显著优势胜出。
AI科技大本营
2021/01/21
1.2K0
足球大数据:统计和分析之间岂止一步之遥
相比于其他体育运动,足球的数据统计和分析工作开展得很晚,而且鉴于比赛的特殊性也没有太多的经验可供参考。不过,随着大数据时代的到来,这种趋势越来越明显,我们需要做的不仅是搜集数据,而且需要更好的分析数据
小莹莹
2018/04/23
5.1K0
足球大数据:统计和分析之间岂止一步之遥
程序员的欧洲杯:用大数据预测胜率,比踢球还刺激
激战正酣的欧洲杯已经进入了淘汰赛阶段,每一场比赛的胜负都牵动着万千球迷的心。天气、场地、球星、战术、伤病、裁判,每一个因素都可能会影响一场比赛的结果。有言道,在足球比赛里,不到最后一刻,你永远不知道事情的结果。对于足彩爱好者来说,不仅在欣赏足球荡气回肠、悬念丛生的魅力,更是在与博彩公司进行一场心理与策略的博弈(其实是为了投注赚钱)。 本文作者从数据层面出发,通过挖掘足球比赛相关的数据特征,结合机器学习的模型方法,对足球比赛的胜、平、负结果进行预测。特别提醒,本文不构成任何投资、下注建议,博彩有风险,下注需注意!
腾讯云开发者
2024/07/04
1.3K2
程序员的欧洲杯:用大数据预测胜率,比踢球还刺激
DeepMind为何缺席GPT盛宴?原来在教小机器人踢足球
机器之心报道 编辑:陈萍、杜伟 最近,整个 AI 社区都沉浸在 ChatGPT 带来的狂欢中,OpenAI 也一跃成为全球最受瞩目的科技公司。然而,同样把「通用人工智能」作为终极目标的 DeepMind 却缺席了这场狂欢。大众不免好奇:DeepMind 最近在忙什么?刚刚,DeepMind 似乎回应了这个问题:他们把一直以来坚持的强化学习带到了物理世界,做出了一些可以自己学习踢足球的具身智能体小机器人。 在很多学者看来,具身智能是通往 AGI 的一个非常有前途的方向,而 ChatGPT 的成功也离不开以强化
机器之心
2023/05/01
3810
DeepMind为何缺席GPT盛宴?原来在教小机器人踢足球
「毫米级越位」?这个AI黑科技,让阿根廷哭泣
本次世界杯上,采用的AI黑科技有足球AI RIHLA、半自动越位技术SAOT、视频助理裁判VAR。
新智元
2023/01/08
4840
「毫米级越位」?这个AI黑科技,让阿根廷哭泣
AI能「踢足球」了,但AI机器人还不能
---- 新智元报道   编辑:武穆 【新智元导读】DeepMind的研究团队,通过计算机模拟数十年足球比赛的情况,训练AI学会了熟练地控制数字人形足球运动员,但还仅限于足球网络游戏,不能用于机器人硬件上。 今年11月,世界杯又要开赛了。 到时候,不管踢不踢,踢得好还是踢得不好,又会有很多人开始聊足球了。 没办法,谁叫足球是世界第一大运动呢。 不过相比于世界杯,科学家对年度机器人杯3D模拟联盟更感兴趣。 不久前,来自英国人工智能公司DeepMind的研究团队,利用一种加速版运动课程,通过计算机模拟数十
新智元
2022/09/14
6120
AI能「踢足球」了,但AI机器人还不能
大数据时代造未来体育战士
去年7月底一场热身赛皇马1-0击败巴黎,乏味的比赛之后,出现极有意思的一幕:伊布脱掉球衣和球裤,黑色“比基尼”造型惊呆球迷。伊布的胸衣引发外界的热议;没过两天,球迷发现皇马的巨星们也穿着这套神器。C罗
大数据文摘
2018/05/21
8090
【2018世界杯数据分析】梅西为什么进不了球?
来源:fivethirtyeight.com 作者:Bobby Gardiner 编译:闻菲 【新智元导读】在阿根廷vs冰岛一战中,梅西的表现引来无数吐槽,不仅射丢点球,全场大部分时间还在“散步”。但
新智元
2018/06/25
7100
[AI新知] Google大脑开源足球游戏增强学习环境
教AI踢足球!进行足球比赛所需要掌握的传球、防守等技巧与决策能力,对于增强学习技术来说是一大挑战
阿泽
2019/06/21
8850
[AI新知] Google大脑开源足球游戏增强学习环境
Python 带你分析,英超是否已经大结局
随着本轮英超战罢,领头羊利物浦已经领先第二名曼城8分之多,新赛季的8连胜,不仅彰显着红军将士誓夺英超首冠的决心,也似乎在提醒着英超诸强,利物浦的复兴已然来临。
数据森麟
2019/10/09
5410
Python 带你分析,英超是否已经大结局
腾讯绝悟AI转行踢足球,还在曼城的Kaggle竞赛中夺冠了
机器之心报道 作者:泽南 绝悟:我跟瓜迪奥拉执教的曼彻斯特城「进行了一番交流」。 从打王者荣耀到踢足球,腾讯 AI Lab 的绝悟最近有了又一次进化。 12 月 30 日,首届谷歌足球 Kaggle 竞赛正式结束,来自腾讯 AI Lab 的绝悟 WeKick 版本,凭借 1785.8 的总分在与全球顶级技术团队的竞技中以显著优势获得了冠军。 这是自今年 11 月底,腾讯 AI Lab 与王者荣耀联合研发的策略协作型 AI 绝悟升级为完全体之后,腾讯 AI 的又一次新尝试。 在 11 月 28-30 日手游
机器之心
2023/03/29
5720
腾讯绝悟AI转行踢足球,还在曼城的Kaggle竞赛中夺冠了
超级碗另一面:大逆转背后,你没看到的人工智能大PK
量子位 | 舒石 若朴 假装发自 休斯顿 NRG球场的气温有点低,但身在现场只能感受到火热。 常规时间结束,亚特兰大猎鹰打了三节好球,新英格兰爱国者打了一节好球,双方比分定格在28-28。超级碗,这场
量子位
2018/01/30
6470
超级碗另一面:大逆转背后,你没看到的人工智能大PK
当足球遭遇大数据,胜负靠计算还是直觉
2013/14赛季英超联赛戏剧性地画上句号,如果说还有什么比最后一轮才决出冠军归属更让人跌破眼镜的,一定是卫冕冠军“红魔”曼联的快速衰落和名不见经传的埃弗顿异军突起。埃弗顿不仅力压曼联,排名甚至高于转
小莹莹
2018/04/18
2.6K0
当足球遭遇大数据,胜负靠计算还是直觉
推荐阅读
相关推荐
利物浦用DeepMind的AI制定战术已有三年了
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档