Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >性能优于RTX 4090!摩尔线程千卡智算集群助力国产大模型训推

性能优于RTX 4090!摩尔线程千卡智算集群助力国产大模型训推

作者头像
芯智讯
发布于 2024-06-18 08:41:31
发布于 2024-06-18 08:41:31
3210
举报
文章被收录于专栏:芯智讯芯智讯
以大模型为代表的新一代人工智能技术是引领新一轮科技革命和产业变革的战略性技术和重要驱动力量,随着对算力需求的日益高涨,人工智能算力底座公司日益成为新一波人工智能技术浪潮重要组成部分。

2024年5月,摩尔线程与智谱AI开展了新一轮GPU 大模型适配及性能测试,包括大模型推理以及基于夸娥(KUAE)千卡智算集群的大模型预训练。测试用相关大模型来自智谱AI基座大模型及其开源版本。

测试结果表明,在推理方面,摩尔线程自研全功能GPU显著优于基准对比产品RTX 3090和RTX 4090,在全部测试用例中优于RTX 3090,在多batch下优于RTX 4090;在训练方面,摩尔线程夸娥千卡智算集群训练精度与A100集群误差在1%以内,夸娥千卡智算集群性能扩展系数超过90%,模型算力利用率(MFU)与A100集群相当。

智谱AI致力于打造新一代认知智能大模型,专注于做大模型的中国创新。早在2022年8月,智谱AI开源了GLM-130B模型,2023 年,智谱 AI 推出千亿基座对话模型ChatGLM,开源版本的 ChatGLM-6B 让大模型开发者的本地微调和部署成为可能,在开源社区受到广泛欢迎。从自主开发的原创GLM预训练框架搭建之初,智谱AI就十分注意算力利用率问题。通过国产算力适配,智谱AI已支持10余种国产硬件生态,努力推动建设大模型软硬件生态和与国产芯片企业的联合创新与升级。

摩尔线程出色的测试结果对于更好建设中国大模型产品技术生态具有重要意义。

▽ 技术自主新突破:摩尔线程千卡智算集群成功应用ChatGLM预训练,标志着摩尔线程全功能GPU算力底座有能力支撑行业领先的大模型全链条研发,有助于增强技术自主性,保障信息安全。大模型训练与推理将能够在全国产可控的算力底座上运行,在满足信息安全的前提下服务于千行百业,成为发展AI+新质生产力的核心力量。

▽ 助力打破算力瓶颈:Scaling laws(尺度定律)已经预示了AGI技术发展对算力日益增长的需求规律,同时也表明有限的算力供应可能成为制约大模型发展的关键瓶颈。本次测试结果显示,国产GPU算力底座有能力助力中国人工智能技术发展。摩尔线程作为国产GPU的代表,将助力提高大模型迭代速度和自研水平,助推中国大模型更好发展。

▽ 开拓创新空间:算法、算力、数据是AGI技术的核心要素,摩尔线程与智谱AI卓有成效的适配与测试合作,有利于推动实现软硬件的深度融合与协同创新,有利于助力中国大模型实现更好发展。

▽ 降低运营成本:摩尔线程凭借自研国产全功能GPU,致力于构建先进的AGI算力底座,不仅能够兼容适配全球主流AI软件生态,节约软件迁移成本,而且在单位算力总体拥有成本上拥有较为明显优势,能够有效降低大模型产品研发成本。

智谱AI硬件适配与测试负责人表示:“摩尔线程夸娥千卡智算集群在计算精度和稳定性等方面的表现令人印象深刻,智谱AI将与包括摩尔线程在内的大模型产业生态合作伙伴携手,共同推动大模型产业生态繁荣发展。”

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 芯智讯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
百亿token免费用!国产平台一键拖拽定制大模型,多元算力极具性价比
就在今天,无问芯穹发布了基于多芯片算力底座的无穹Infini-AI大模型开发与服务平台,并宣布自3月31日起正式开放全量注册,给所有实名注册的个人和企业用户提供百亿tokens免费配额。
新智元
2024/04/12
2550
百亿token免费用!国产平台一键拖拽定制大模型,多元算力极具性价比
面向超万卡集群的新型智算技术白皮书
自ChatGPT发布以来,科技界掀起了一场大模型的竞争热潮。数据成为新生产要素,算力成为新基础能源,大模型则成为新生产工具,各行各业从“+AI”向“AI+”的转变已势不可挡。随着模型参数量从千亿迈向万亿,模型能力更加泛化,大模型对底层算力的诉求进一步升级,万卡集群成为这一轮大模型基建军备竞赛的标配。
用户6874558
2024/04/30
1.3K0
面向超万卡集群的新型智算技术白皮书
面向超万卡集群的新型智算技术白皮书
自ChatGPT发布以来,科技界掀起了一场大模型的竞争热潮。数据成为新生产要素,算力成为新基础能源,大模型则成为新生产工具,各行各业从“+AI”向“AI+”的转变已势不可挡。随着模型参数量从千亿迈向万亿,模型能力更加泛化,大模型对底层算力的诉求进一步升级,万卡集群成为这一轮大模型基建军备竞赛的标配。
通往ICT之路
2024/06/18
6460
面向超万卡集群的新型智算技术白皮书
摩尔线程宣布完成15亿B轮融资!
2022年12月27日消息,摩尔线程通过官方微信宣布成功完成了15亿B轮融资,并已顺利完成交割。本轮融资由中移数字新经济产业基金、和谐健康保险领投,典实资本跟投。融资资金将持续用于摩尔线程多功能GPU的快速迭代,MUSA架构创新及相关IP的研发。至此,摩尔线程成立两年已完成四次融资,为公司的稳定长远发展提供了重要保障。
芯智讯
2023/02/09
3490
第一台AI算力本上市:原生Linux环境、本地训推320亿参数模型!七步搭出智能体,还支持跨应用调度APP
DeepSeek 发布后,全球兴起大模型开源浪潮,Meta 刚刚发布 Llama4,谷歌、微软等科技巨头也在 AI 领域不断推陈出新,连 OpenAI 的 GPT-5 不久前都官宣要免费开放了。与此同时,各类 AI 应用工具层出不穷,并吸引了越来越多的大众群体。
深度学习与Python
2025/04/13
1270
第一台AI算力本上市:原生Linux环境、本地训推320亿参数模型!七步搭出智能体,还支持跨应用调度APP
最接近GPT-4的国产大模型诞生了
在 1 月 16 日举办的 2024 智谱 AI 技术开放日 Zhipu DevDay 上,智谱 AI 正式发布新一代基座大模型「GLM-4」。
机器之心
2024/01/17
3640
最接近GPT-4的国产大模型诞生了
FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎
今天,清华系科创企业清程极智与清华大学翟季冬教授团队联合宣布开源大模型推理引擎「赤兔」(Chitu),率先实现了非 H 卡设备(英伟达 Hopper 架构之前的 GPU 卡及各类国产卡)运行原生 FP8 模型的突破。
机器之心
2025/03/14
2510
FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎
腾讯云:为国产化智算云筑基
智算中心要达成的任务或者目标是,完成特定的一个或多个大模型训练或者推理的任务。而完成这个任务所需要的内容包括算法、数据和算力。因此,要求智算中心必须具备对算法进行开发、优化、调度的模型管理能力,算力和数据所对应的高性能计算和高性能存储能力,以及算力和数据交互所需要的高性能网络能力。
腾讯专有云
2024/04/23
6490
腾讯云:为国产化智算云筑基
智谱 AI 狂飙:与商业化博弈的一年
2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时,张帆如是说。
AI科技评论
2024/03/18
4440
智谱 AI 狂飙:与商业化博弈的一年
揽获三项大奖!腾讯云智算套件正加速大模型应用落地!
数字经济时代,AI技术正以前所未有的速度重塑着千行百业,不仅改变了行业的商业模式,也催生了新的服务形态,对全球经济社会产生了深远影响。
腾讯专有云
2025/02/05
1680
揽获三项大奖!腾讯云智算套件正加速大模型应用落地!
一场算力的盛宴,英伟达CES2025发布会RTX5090和算力盒子
在2025年的CES大会上,英伟达CEO黄仁勋在拉斯维加斯 CES 2025 展会上发表了主题演讲(keynote),涉及到的话题包括 GPU、AI、游戏、机器人等等。
通信行业搬砖工
2025/01/09
7660
一场算力的盛宴,英伟达CES2025发布会RTX5090和算力盒子
摩尔线程发布全新多功能GPU及软硬件产品,构建以MUSA为核心的全栈能力
2022年11月3日,北京——摩尔线程2022秋季发布会今日在北京中关村国家自主创新示范区成功举办。发布会上,摩尔线程推出全新多功能GPU芯片“春晓”、基于MUSA架构打造的业内首款国潮显卡MTT S80和面向服务器应用的MTT S3000,以及元计算一体机MCCX。这是时隔7个月后,摩尔线程多功能GPU产品迭代创新实现的又一次跨越。
芯智讯
2022/11/22
8800
摩尔线程发布全新多功能GPU及软硬件产品,构建以MUSA为核心的全栈能力
全球最强智算来了:12000000000000000000(别数了18个0)FLOPS!
金磊 梦晨 假装发自 张北县 量子位 | 公众号 QbitAI “全球最强智算”王座,刚刚易主。 来自中国河北省张北县的“中国选手”,一举击败谷歌。 △图:张北县草原 而其所凭借的算力值,每秒浮点运算次数已经高达12EFLOPS(百亿亿次)。 相比之下,谷歌单集群算力峰值是9EFLOPS,特斯拉也仅有1.9EFLOPS。 那么张北县的这个“速度”,到底有多快? 举个例子 。 以前要训练一个自动驾驶的模型,大概需要花费的时间是7天。 而在“全球最强算力”加持之下,这个时间直接缩短到了1小时之内,整整提速
量子位
2022/08/31
4470
全球最强智算来了:12000000000000000000(别数了18个0)FLOPS!
价格战之后,智谱来到商业化的下一站
这次价格战的两股势力分别是互联网大厂和大模型创业公司,以字节、阿里云、腾讯和智谱为主要参战代表。
AI科技评论
2024/06/17
1540
价格战之后,智谱来到商业化的下一站
🌍 算力即权力?解析AI竞赛背后的基础设施战争
2023年ChatGPT的爆发,揭开了AI竞赛的冰山一角:GPT-4训练消耗的算力≈5亿度电,足够支撑一个小国全年用电。全球科技巨头疯狂囤积GPU,OpenAI被曝“算力饥荒”限制模型迭代速度。算力,这个曾经藏在代码背后的“隐形资源”,正成为大国博弈与企业竞争的核心战场。
Jimaks
2025/03/20
1340
别再说国产大模型技术突破要靠 Llama 3 开源了
近日,千呼万唤之下,Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本,再次震动 AI 圈。
AI科技评论
2024/05/06
4210
别再说国产大模型技术突破要靠 Llama 3 开源了
全球GPU缺口超40万张!算力之困,中国大模型有解了
然而,这个领域的中美差异性,决定了这一事实:美国现在的格局,未必就是中国未来的格局。
新智元
2023/09/09
7260
全球GPU缺口超40万张!算力之困,中国大模型有解了
数智化转型风高浪急,天翼云如何助力产业踏浪而行?
穿越产业周期,用数字化的力量重塑企业经营与增长的逻辑,再次成为数字化技术应用的主旋律,也是下一阶段产业投资的重点。
科技云报道
2025/03/04
1230
数智化转型风高浪急,天翼云如何助力产业踏浪而行?
南京智算中心:算力枢纽节点新标杆
有统计表明,AI模型训练所需的算力平均100天就会翻番,这意味着对算力的需求每隔5年要翻十万倍以上。
IT创事记
2022/08/30
1.4K0
南京智算中心:算力枢纽节点新标杆
推荐阅读
相关推荐
百亿token免费用!国产平台一键拖拽定制大模型,多元算力极具性价比
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档