首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

蚂蚁集团新招!持续优化芯片降低AI成本,百灵大模型训练将开源

近期,蚂蚁集团在AI领域的最新进展引起了广泛关注。据新浪科技报道,蚂蚁集团针对市场关注的“百灵”大模型训练成本问题作出了正式回应。蚂蚁集团表示,他们正致力于通过不断优化不同芯片的使用,来有效降低AI应用的成本,并且已经在这一领域取得了一些显著的成果。未来,这些成果还将逐步通过开源的方式与业界分享。

事件的背景是这样的:蚂蚁集团的Ling团队最近在预印版Arxiv平台上发表了一篇技术论文,详细阐述了他们的最新研究成果。论文中,他们推出了两款基于混合专家(MoE)架构的大语言模型——百灵轻量版(Ling-Lite)和百灵增强版(Ling-Plus)。这两款模型不仅在规模上有所不同,更重要的是,它们采用了一系列创新方法,使得在低性能硬件上也能高效训练大模型,从而显著降低了成本。

具体来说,百灵轻量版的参数规模达到了168亿,其中激活参数为27.5亿;而增强版的基座模型参数规模更是高达2900亿,激活参数也有288亿。这两款模型的性能均达到了行业领先水平。实验数据显示,他们的3000亿参数MoE大模型在使用国产GPU的低性能设备上也能完成高效训练,其性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。

这一成果的发布,无疑为AI领域带来了新的突破。蚂蚁集团通过技术创新,不仅提高了大模型的训练效率,还降低了对高性能硬件的依赖,使得更多企业和研究机构能够在有限的资源条件下开展AI研究和应用。

蚂蚁集团还表示,他们将继续在AI领域进行探索和创新,不断推出更多具有实际应用价值的技术成果。同时,他们也欢迎业界同行和研究者共同参与和分享这些成果,共同推动AI技术的发展和应用。

可以预见的是,随着蚂蚁集团在AI领域的不断探索和创新,未来将有更多具有颠覆性的技术成果涌现出来,为各行各业带来更加智能化和高效化的解决方案。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/ORVgoFLh3T8N7iNB7El7ZDiw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券
首页
学习
活动
专区
圈层
工具