Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >半年内第二块国产全功能GPU,附带首个游戏显卡!摩尔线程造芯神速,张建中“黄”气逼人

半年内第二块国产全功能GPU,附带首个游戏显卡!摩尔线程造芯神速,张建中“黄”气逼人

作者头像
量子位
发布于 2022-12-08 07:03:31
发布于 2022-12-08 07:03:31
5860
举报
文章被收录于专栏:量子位量子位
金磊 发自 凹非寺 量子位 | 公众号 QbitAI

他来了,他来了。

手持GPU,一身黑皮衣、下装牛仔裤、黄皮肤长头发,黑框眼镜之下挡不住硬汉气场。

但他不是英伟达的老黄。

他是曾经老黄左膀右臂之一的老张——

张建中,James,此前在英伟达中国区任职一把手长达15年时间。

现在更被人熟知的头衔,是国内GPU公司摩尔线程的创始人兼CEO。

而这次刚刚捂热的GPU,已经是他在今年量产上市的第2个——

时隔,仅半年之久。

不仅如此,附着在这块GPU上的标签还有更多:

国产全功能全球首个中高端……

而且基于它,张建中更是发布了国内首个中高端游戏显卡

讲真,很难想象这般“速度”是由一家刚刚成立2年的公司所创造的。

由此不免让人心生疑问:

在做到快的同时,质量和性能上是否也一并跟上了呢?

我们不妨一同来看看。

全球首个支持PCIe接口的全功能GPU

摩尔线程的第二个国产全功能GPU,名为“MT-春晓”

张建中也是将它作为打头阵的产品发布。

据了解,春晓集成了220亿个晶体管,内置4096MUSA架构通用计算核心以及128张量计算核心,可以支持FP32、FP16和INT8等计算精度。

其它重点参数如下:

  • GPU核心频率:1.8GHz
  • FP32计算能力:14.4 TFLOPS
  • INT8计算能力:57.6 TOPS
  • 显存宽带:448GB/s
  • 显存类型:GDDR6

张健中在现场还提及,春晓解锁了一项“全球第一”:

因为它是业内唯一支持PCIe Gen5接口的GPU。

(许多厂商已经达成共识,PCIe Gen5将会是未来消费级以及企业级存储设备的重点发展方向。)

那么与半年前摩尔线程所发布的“苏堤”GPU相比,二者又有何区别?

张建中表示在摩尔线程GPU四大引擎方面,春晓做到了全面升级:

  • 现代图形渲染引擎性能最高提升3-5倍
  • AI计算加速引擎性能最高提升4倍
  • 智能多媒体引擎性能最高提升4倍
  • 物理仿真引擎性能最高提升2.5倍

至于为什么摩尔线程要在半年时间就将自家GPU推陈出新,这个问题我们请教了下张健中:

我们第一个全功能GPU苏堤,实际上属于中低端处理器,在GPU行业中可以满足国内国产化应用的需求。 但对于大部分主流用户,他们还是期待更高性能的GPU,因此我们快速发布了春晓,去满足高端的游戏玩家,满足更多用户对图形和计算的需要。 如此一来,我们的产品就能够覆盖高中低端的所有用户。

而提到了游戏,张建中基于春晓GPU,便发布了另一款“国内第一”的产品。

国内首款游戏显卡

其实摩尔线程在半年前基于苏堤也发布过显卡产品MTT S60

但这张显卡的“用武之地”似乎更多面向的是产业,也就是B端。

而这次基于春晓打造的这张显卡MTT S80,则是能让更多大众摸得着的那种了——国内首款游戏显卡

在现场,张建中还用了一个比较有意思的词来形容它:“国潮”

从性能方面来看,其拥有的4096个可编程MUSA核心,在1.8GHz的主频下,能够提供14.4TFLOPS的单精度浮点算力。

与春晓相似的,MTT S80也是业内首款配备PCIe Gen5接口的显卡产品:

配合16GB GDDR6大容量高速显存,再辅以8K超高清与1080P 360Hz高刷新率显示输出能力,能为游戏玩家带来很好的体验。

似乎“光说不练”并不是摩尔线程发布会的风格,跟上次一样,张建中同样是在现场直接上效果。

例如它已经在Windows环境中适配了《暗黑破坏神3》,而这款游戏对于显卡性能要求还是较高的那种。

而有了MTT S80的加持,即便全程是在4K高清画质的情况下,FPS也能保持在60左右(FPS越高画面越流畅)。

除此之外,张建中还展示了赛车游戏爱好者钟爱的《极品飞车》,在MTT S80下的效果,可以说是相当的丝滑了:

据了解,目前MTT S80已经在Windows驱动内置了MUSA DirectX Driver模块,并完成了对数十款主流游戏的适配。

更重要的是,张建中说这款显卡将会在双十一当日限量开售

那么到手后的实际效果如何、价格香不香,也是可以期待一下了。

新款全功能服务器GPU产品

服务器方面的产品,摩尔线程这次也有更新——MTT S3000

同样的,它也是基于MUSA架构、春晓GPU,算力可以覆盖图形渲染、视频处理深度学习的完整MUSA软件栈。

支持的场景包括AI推理和训练、云游戏云渲染、视频云、数字孪生、数字内容创作等。

从性能上来看,MTT S3000包含了4096个MUSA流处理核心及128个专用张量计算核心,晶体管规模达到220亿。

其运行频率为1.9GHz,显存位宽256bit;搭配32GB GDDR6显存,带宽为448GB/s;可以支持FP32、FP16、INT8等多种计算精度,其中FP32算力可达15.2TFLOPS。

在张建中看来,生态协作对于AI应用的推进至关重要

因此,MTT S3000还兼容了PyTorch、TensorFlow、百度飞桨(PaddlePaddle)、计图(Jittor)等多种主流深度学习框架,并实现了对Transformer、CNN、RNN等数十类AI模型的加速。

而且MTT S3000可以说是做到了“与时俱进”,最近大火的AI作画:Disco Diffusion、Stable Diffusion也是同样能够hold住。

不仅仅是硬件的更新

而除了上述的硬件产品之外,纵观正常发布会,“软硬件结合”也是摩尔线程的一大特点。

这一点其实也不难理解,在我们与张建中交流的过程中,他也道出了缘由:

软件生态是推动GPU计算普及的关键。 GPU的研发体系是非常复杂的,有了硬件才能去开发软件,软件在硬件上跑起来了之后,还需要做更多优化;优化之后又会发现架构存在缺陷,反过来又得优化硬件。 硬件、软件是互相迭代、不停提升的一个过程。

为此,摩尔线程这次以MUSA架构为核心,摩尔线程发布了完备的MUSA软件栈

其目的就是服务广大的开发者和终端用户。

除此之外,摩尔线程在GPU云原生、元宇宙、AIGC方面均有相应的新动作。

One More Thing

还是聚焦在张建中这次的outfit:

这个皮夹克,嗯,着实有点意思。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-11-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
2999元国产显卡抢疯了,Steam游戏实测能玩,老黄旧将打造
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 显卡还能搞“国潮”? 没错,国产显卡品牌摩尔线程宣布旗下游戏显卡最近上了一批货,不再限制购买资格,而是先抢先得。 这样一条消息吸引了不少显卡爱好者关注。 在京东,已经被热情的网友顶上了趋势榜第8名。 为啥这样一款产品能如此受欢迎? 两大亮点:首个支持Windows的国产显卡,而且真的能玩游戏。 在京东上面热评第一就是“大呼一声好家伙,完全超出了预期,作为游戏玩家我是很满意的”。 MTT S80去年双十一首次开卖,发布会现场就演示过4K分辨率运行《
量子位
2023/03/13
4370
2999元国产显卡抢疯了,Steam游戏实测能玩,老黄旧将打造
寒武纪:AI智算中心推动业绩暴涨42倍,但成为中国英伟达还早
寒武纪-U(SH:688256)的AI芯片相关产品线包括云端产品线(云端智能芯片及板卡,如思元(MLU)系列(如MLU370、MLU290)及配套加速卡,专为数据中心的高性能AI训练和推理设计)、边缘产品线(边缘计算芯片,如思元220(MLU220),适用于智能安防、工业控制等低延迟场景)、IP 授权及软件(如寒武纪1A、1H处理器IP,用于智能手机、机器人等设备的本地AI处理)、智能计算集群系统业务(打包好的AI数据中心集群,软硬件整体解决方案)。
AIGC部落
2025/04/22
2090
寒武纪:AI智算中心推动业绩暴涨42倍,但成为中国英伟达还早
国产游戏显卡摩尔线程MTT S70开卖:7nm工艺7GB显存,2499元现货
6月1日消息,摩尔线程MTT S70国产游戏显卡于5月31日正式发布,定价2499元。目前官方已经开始销售,而且还是现货。
芯智讯
2023/08/09
3400
国产游戏显卡摩尔线程MTT S70开卖:7nm工艺7GB显存,2499元现货
摩尔线程发布全新多功能GPU及软硬件产品,构建以MUSA为核心的全栈能力
2022年11月3日,北京——摩尔线程2022秋季发布会今日在北京中关村国家自主创新示范区成功举办。发布会上,摩尔线程推出全新多功能GPU芯片“春晓”、基于MUSA架构打造的业内首款国潮显卡MTT S80和面向服务器应用的MTT S3000,以及元计算一体机MCCX。这是时隔7个月后,摩尔线程多功能GPU产品迭代创新实现的又一次跨越。
芯智讯
2022/11/22
8620
摩尔线程发布全新多功能GPU及软硬件产品,构建以MUSA为核心的全栈能力
离开英伟达仅19个月,他交出了一块国产全功能GPU
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 当他拿出这块GPU时,现场可谓是掌声与惊叹交错。 他叫张建中 (James Zhang),很多人熟知这个名字,是因为他曾是英伟达中国区的一把手,任职长达15年之久。 但在2020年9月,张建中选择离开英伟达,并于次月创办了摩尔线程这家公司。 而他这一次的出场,之所以会有刚才那般反响,主要还是这块GPU身上有太多的标签值得关注—— 国产、全功能、耗时仅18个月、量产上市…… 讲真,很难想象这是一家GPU界“新生儿”能做出来的事情。 那么在这场发布会中,
量子位
2022/04/01
5110
离开英伟达仅19个月,他交出了一块国产全功能GPU
英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑
近期,AIGC领域呈现出一片繁荣景象,其背后离不开强大算力的支持。以ChatGPT为例,其高效的运行依赖于一台由微软投资建造的超级计算机。这台超级计算机配备了数万个NVIDIA A100 GPU,并利用60多个数据中心的数十万个GPU辅助,为ChatGPT提供了强大的算力支持。这种规模的算力部署不仅体现了AIGC技术的先进性,也预示着人工智能技术未来的发展趋势。这种集成了高性能计算、大数据处理和人工智能算法的超级计算机,将成为推动科技进步的重要引擎。
汀丶人工智能
2024/01/29
8K0
英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑
大厂华人改做「中国芯」!摩尔线程、壁仞科技双双发布GPU,对标英伟达
---- 新智元报道   编辑:袁榭 好困 David 【新智元导读】中国国产GPU即将进入市场?摩尔线程发布通用GPU芯片与2款显卡,壁仞科技也宣布自己的通用GPU芯片BR100一次点亮成功。 这两天,国产芯片界全是「大新闻」! 30日,英伟达前中国区一把手张建中率领的摩尔线程,推出了国产通用GPU芯片「苏堤」、桌面级显卡MTT S60和服务器用显卡MTT S2000。 31日,哈佛博士、投资界资深人士张文先生的壁仞科技,又在当天晚上宣布自家的首款通用GPU芯片BR100系列一次点亮成功。 显卡两连
新智元
2022/04/02
1.4K0
大厂华人改做「中国芯」!摩尔线程、壁仞科技双双发布GPU,对标英伟达
摩尔线程宣布完成15亿B轮融资!
2022年12月27日消息,摩尔线程通过官方微信宣布成功完成了15亿B轮融资,并已顺利完成交割。本轮融资由中移数字新经济产业基金、和谐健康保险领投,典实资本跟投。融资资金将持续用于摩尔线程多功能GPU的快速迭代,MUSA架构创新及相关IP的研发。至此,摩尔线程成立两年已完成四次融资,为公司的稳定长远发展提供了重要保障。
芯智讯
2023/02/09
3460
老黄 5090 都被初创公司虐了?印度 CEO 用 20 人团队让芯片快10 倍、功耗大砍近 80%!网友:等英伟达收购
在图形处理器(GPU)领域,英伟达、AMD 和英特尔占据主导地位已有一段时间了。虽然中国还有其他相关企业,但他们要打入美国市场一直以来都困难重重。
深度学习与Python
2025/03/24
960
老黄 5090 都被初创公司虐了?印度 CEO 用 20 人团队让芯片快10 倍、功耗大砍近 80%!网友:等英伟达收购
一场算力的盛宴,英伟达CES2025发布会RTX5090和算力盒子
在2025年的CES大会上,英伟达CEO黄仁勋在拉斯维加斯 CES 2025 展会上发表了主题演讲(keynote),涉及到的话题包括 GPU、AI、游戏、机器人等等。
通信行业搬砖工
2025/01/09
7000
一场算力的盛宴,英伟达CES2025发布会RTX5090和算力盒子
国产GPU云桌面市场:芯力量入局,春风渐起
云桌面,从诞生之日起就天赋异禀,凭借灵活部署、统一管理、易于运维、安全可控等优势不断拓展市场版图。
IT创事记
2023/02/17
8990
国产GPU云桌面市场:芯力量入局,春风渐起
【AI系统】GPU 架构回顾(从2018年-2024年)
2018 年 Turing 图灵架构发布,采用 TSMC 12 nm 工艺,总共 18.6 亿个晶体管。在 PC 游戏、专业图形应用程序和深度学习推理方面,效率和性能都取得了重大进步。相比上一代 Volta 架构主要更新了 Tensor Core(专门为执行张量/矩阵操作而设计的专门执行单元,深度学习计算核心)、CUDA 和 CuDNN 库的不断改进,更好地应用于深度学习推理。RT Core(Ray Tracing Core)提供实时的光线跟踪渲染,包括具有物理上精确的投影、反射和折射,更逼真的渲染物体和环境。支持 GDDR6 内存,与 GDDR5 内存相比,拥有 14 Gbps 传输速率,实现了 20%的的效率提升。NVLink2.0 支持 100 GB/s 双向带宽,使特定的工作负载能够有效地跨两个 GPU 进行分割并共享内存。
用户11307734
2024/11/27
3450
国产GPU为何“一夜杀到老黄城下”?
鱼羊 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 国产GPU,这波发展势头有点猛啊。 先是芯动科技在去年底推出一颗“风华1号”,剑指高性能桌面级/服务器级显卡市场。 现在摩尔线程仅用18个月时间,量产上市了一款全功能国产GPU。壁仞科技也紧跟着宣布首款通用GPU芯片点亮成功。 如此速度和成果,甚至引来外界惊叹: 这是一夕之间就杀到了老黄城墙下的节奏? 大家最关心的,一是产品本身,性能、价格、啥时能买到。 再就是背后的行业突然火爆的原因,“怎么就做到了?”、“专利咋就饶过了?” 热议之中,“IP
量子位
2022/04/08
6400
国产GPU为何“一夜杀到老黄城下”?
美国新规之下,多数国产先进制程芯片海外代工暂不受影响!
10月21日消息,虽然美国政府于10月7日出台了针对中国大陆的出口管制新规,一些中国大陆的芯片制造商受到了较大的影响,但是对于多数的中国大陆芯片设计厂商来说,目前的影响相对有限。比如据彭博社报道,中国GUP厂商壁仞科技最新的7nm GPU芯片BR100依然能够继续由台积电代工。
芯智讯
2022/10/28
9060
美国新规之下,多数国产先进制程芯片海外代工暂不受影响!
有人拿当今最强GPU A6000和3090做了性能对比,网友:都买不起
机器之心报道 编辑:泽南 又到了人们喜闻乐见的显卡对决时间。 虽然如今人们用来训练深度学习的 GPU 大多出自英伟达,但它旗下的产品经常会让人在购买时难以抉择。 去年 12 月,英伟达将专业图形加速显卡产品线更新至安培架构,其中最高端的 RTX A6000 是最被人关注的一款。 在基本规格上,A6000 基于完整的 GA102 GPU 核心打造,内建 10752 个 CUDA 核心和第三代 Tensor Core,单精度浮点性能达到了 38.7 TFLOPs。它的显存容量达到 48GB,类型是 GDDR6
机器之心
2023/03/29
4.6K0
有人拿当今最强GPU A6000和3090做了性能对比,网友:都买不起
NVIDIA消费级显卡4060/4090 AI训练能效比较
NVIDIA GeForce RTX 4060 是基于Ada Lovelace架构的一款显卡,它被设计为中端市场的产品,旨在提供高性能的同时保持相对较低的功耗和价格点。
用户7353950
2024/07/05
3.4K0
NVIDIA消费级显卡4060/4090 AI训练能效比较
DeepSeek 开源周过后,国产芯片厂在焦虑中狂欢
DeepSeek 上周一口气开源了五个开源库,这些项目看似技术名词堆砌,但实际上都是在解决 AI 计算中的关键问题,尤其是针对英伟达 GPU 的优化。
深度学习与Python
2025/03/07
1520
DeepSeek 开源周过后,国产芯片厂在焦虑中狂欢
深度 | 英伟达深度学习Tensor Core全面解析
AI 科技评论消息,不久前,NVIDIA在SIGGRAPH 2018上正式发布了新一代GPU架构——Turing(图灵),黄仁勋称Turing架构是自2006年CUDA GPU发明以来最大的飞跃。Turing架构的两大重要特性便是集成了用于光线追踪的RT Core以及用于AI计算的Tensor Core,使其成为了全球首款支持实时光线追踪的GPU。
AI科技评论
2018/09/21
4K0
深度 | 英伟达深度学习Tensor Core全面解析
民间大神魔改 4090 48G 秒杀 5090!老黄显卡炒作被打脸,“最失败 50 系显卡”也支棱起不来了?
近期,淘宝和闲鱼上很多厂家在出售至少 2.2 万的 4090 48G 显卡,这是一款“全新”、非官方规格的显卡。淘宝厂家甚至给出了基础款和升级款两种选择,其中基础款用的是拆机进口颗粒(19000 频率)和非定制全新 PCB 板,耐久度略低,升级版则用的是全新进口颗粒(21000 频率)和全新定制 PCB 板,耐久度高。不过厂家保证这两款都在前期性能稳定,并质保三年。
深度学习与Python
2025/03/10
4330
民间大神魔改 4090 48G 秒杀 5090!老黄显卡炒作被打脸,“最失败 50 系显卡”也支棱起不来了?
AI开发硬件基础经验
主要介绍主机GPUx1/GPUx2的配置,GPUx4/GPUx8的配置后面介绍,建议结论如下,3080版本总计13000左右,3090版本总计21000左右(显卡加6000左右换成3090,电源换成1000w,其他不需要变即可)。
timerring
2023/10/13
4150
AI开发硬件基础经验
推荐阅读
2999元国产显卡抢疯了,Steam游戏实测能玩,老黄旧将打造
4370
寒武纪:AI智算中心推动业绩暴涨42倍,但成为中国英伟达还早
2090
国产游戏显卡摩尔线程MTT S70开卖:7nm工艺7GB显存,2499元现货
3400
摩尔线程发布全新多功能GPU及软硬件产品,构建以MUSA为核心的全栈能力
8620
离开英伟达仅19个月,他交出了一块国产全功能GPU
5110
英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑
8K0
大厂华人改做「中国芯」!摩尔线程、壁仞科技双双发布GPU,对标英伟达
1.4K0
摩尔线程宣布完成15亿B轮融资!
3460
老黄 5090 都被初创公司虐了?印度 CEO 用 20 人团队让芯片快10 倍、功耗大砍近 80%!网友:等英伟达收购
960
一场算力的盛宴,英伟达CES2025发布会RTX5090和算力盒子
7000
国产GPU云桌面市场:芯力量入局,春风渐起
8990
【AI系统】GPU 架构回顾(从2018年-2024年)
3450
国产GPU为何“一夜杀到老黄城下”?
6400
美国新规之下,多数国产先进制程芯片海外代工暂不受影响!
9060
有人拿当今最强GPU A6000和3090做了性能对比,网友:都买不起
4.6K0
NVIDIA消费级显卡4060/4090 AI训练能效比较
3.4K0
DeepSeek 开源周过后,国产芯片厂在焦虑中狂欢
1520
深度 | 英伟达深度学习Tensor Core全面解析
4K0
民间大神魔改 4090 48G 秒杀 5090!老黄显卡炒作被打脸,“最失败 50 系显卡”也支棱起不来了?
4330
AI开发硬件基础经验
4150
相关推荐
2999元国产显卡抢疯了,Steam游戏实测能玩,老黄旧将打造
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档