Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >沐曦首款AI推理GPU及加速卡亮相:INT8算力达160TOPS!

沐曦首款AI推理GPU及加速卡亮相:INT8算力达160TOPS!

作者头像
芯智讯
发布于 2023-08-09 02:03:30
发布于 2023-08-09 02:03:30
2.3K0
举报
文章被收录于专栏:芯智讯芯智讯

6月9日消息,国产GPU厂商沐曦集成电路(以下简称“沐曦”)通过官方微信宣布,在6月7日于北京召开的第16届安博会上,沐曦(MetaX)展出了其首款AI推理GPU加速卡——曦思N100及解决方案在安防领域的应用。

据介绍,曦思N100是一款面向云端数据中心应用的AI推理GPU加速卡,内置异构的GPGPU通用处理器核心“MXN100”,同时集成了HBM2E高带宽内存,单卡的INT8整数算力达160TOPS,FP16浮点算力则达80TFLOPS,具备高带宽、低延时特性。支持128路编码和96路解码的高清视频处理能力,兼容HEVC(H.265)、H.264、AV1、AVS2等多种视频格式,最高支持8K分辨率。

作为对比,英伟达2020 年发布 A100 GPU的INT8 算力达 624TOPS,FP16浮点算力达312TOPS。也就是说,沐曦MXN100的AI算力相当于A100的1/4。

同时,曦思N100还配套有沐曦自主研发的MXMACA软件栈,与硬件架构紧密耦合,支持多种主流框架的网络模型,支持主流计算机视觉处理和多媒体处理框架。加上持续完善的ModelZoo,客户开箱即用,各类应用场景、业务模型可以快速迁移。

在此次的安博会现场,沐曦展示了曦思N100在人脸识别、车辆检测、车牌识别等安防领域的实际应用,沐曦也已加入北京安全防范行业协会。

据介绍,曦思N100已实现规模量产,可广泛应用于智慧城市、智慧安防、智慧交通、云计算智能视频处理等场景。

除了用于AI推理的MXN系列GPU(曦思)之外,沐曦还拥有面向AI训练、AI推理及通用计算的MXC系列通用GPU(GPGPU)芯片,以及针对图形渲染加速的MXG系列GPU,这也意味着沐曦拥有全栈GPU芯片产品。

沐曦表示,其产品均采用完全自主研发的GPU IP,拥有完全自主知识产权的指令集和架构,配以兼容主流GPU生态的完整软件栈(MXMACA),具备高能效和高通用性的天然优势,能够为客户构建软硬件一体的全面生态解决方案,是“双碳”背景下推动数据中心建设和产业数字化、智能化转型升级的算力基石。

编辑:芯智讯-浪客剑

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-06-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 芯智讯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
对话沐曦AI解决方案总监虞新阳:不断迭代创新方能从市场中胜出
沐曦首款异构GPU产品MXN100已于2022年底实现规模量产,并与多家重点行业客户及服务器厂商联合打造应用落地解决方案,展开深度的生态合作。在过去很长一段时间里,GPU市场一直被国外知名企业所主导,近些年来,随着中国经济的不断发展,国家对芯片领域的大力支持,国内涌现出了众多GPU芯片公司,而沐曦就是其中之一。 自2020年9月成立,沐曦就致力于打造全栈GPU芯片产品,目前推出的MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI训练,以及MXG系列GPU(曦彩)用于图形渲染,满足数据中
LiveVideoStack
2023/04/04
5000
对话沐曦AI解决方案总监虞新阳:不断迭代创新方能从市场中胜出
AI计算,为什么要用GPU?
在之前的文章里,小枣君说过,行业里通常会把半导体芯片分为数字芯片和模拟芯片。其中,数字芯片的市场规模占比较大,达到70%左右。
鲜枣课堂
2024/01/03
9080
AI计算,为什么要用GPU?
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
2月20日消息,美国人工智能初创公司Groq最新推出的面向云端大模型的推理芯片引发了业内的广泛关注。其最具特色之处在于,采用了全新的Tensor Streaming Architecture (TSA) 架构,以及拥有超高带宽的SRAM,从而使得其对于大模型的推理速度提高了10倍以上,甚至超越了英伟达的GPU。
芯智讯
2024/02/26
5600
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
上海张江又一款AI芯发布!性能超英伟达T4,AMD背景团队创办,快手投资
今年4月刚刚5亿元人民币A+轮融资的AI芯片公司瀚博半导体,发布了云端推理AI芯片SV100系列,以及搭载该系列芯片的AI推理加速卡VA1。
量子位
2021/07/19
5970
国产GPU添新玩家,AMD出身,两款业界第一7nm芯片曾由他打造
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 他在现场只是播放了一张的演讲内容。 竟引得众人不约而同,纷纷高举手机拍照,会场更是掌声不断。 他叫钱军,很多人熟知这个名字,是因为他曾在AMD担任高管一职长达近10年时间。 在此期间,钱军还带领团队设计量产了两个业界第一: 第一颗7nm图形处理器 第一颗7nm GPGPU架构的AI芯片 而刚才现场之所以会有那般反响,正是因为钱军在2018年所成立的瀚博半导体,搞了一个“大动作”—— 预览了国产7nm云端GPU芯片,SG100。 据了解,SG100是集
量子位
2022/09/08
2560
国产GPU添新玩家,AMD出身,两款业界第一7nm芯片曾由他打造
半年内第二块国产全功能GPU,附带首个游戏显卡!摩尔线程造芯神速,张建中“黄”气逼人
据了解,春晓集成了220亿个晶体管,内置4096MUSA架构通用计算核心以及128张量计算核心,可以支持FP32、FP16和INT8等计算精度。
量子位
2022/12/08
6010
半年内第二块国产全功能GPU,附带首个游戏显卡!摩尔线程造芯神速,张建中“黄”气逼人
黄仁勋从煤气灶下取出最新GPU:7nm全新安培架构,售价20万美元,训练性能顶6张V100
因为美国疫情的原因,英伟达和其他科技公司一样,把今年的GPU技术大会(GTC 2020)改成线上举行。
量子位
2020/05/19
9510
黄仁勋从煤气灶下取出最新GPU:7nm全新安培架构,售价20万美元,训练性能顶6张V100
芯动力再创辉煌:M.2 AI加速卡赢得海外知名企业青睐!
在这个充满挑战与机遇的时代,芯动力团队始终以破浪之势,再创辉煌。近日,芯动力迎来了一个令人振奋的喜讯——经过不懈努力和持续创新,芯动力与海外一家知名企业成功交付了首批M.2 AI加速卡订单!这一重要里程碑,是对“芯”技术走进市场的有力证明,也为芯动力未来的发展打开了新的篇章。
人工智能日报
2024/01/25
3770
【AI系统】GPU 架构回顾(从2018年-2024年)
2018 年 Turing 图灵架构发布,采用 TSMC 12 nm 工艺,总共 18.6 亿个晶体管。在 PC 游戏、专业图形应用程序和深度学习推理方面,效率和性能都取得了重大进步。相比上一代 Volta 架构主要更新了 Tensor Core(专门为执行张量/矩阵操作而设计的专门执行单元,深度学习计算核心)、CUDA 和 CuDNN 库的不断改进,更好地应用于深度学习推理。RT Core(Ray Tracing Core)提供实时的光线跟踪渲染,包括具有物理上精确的投影、反射和折射,更逼真的渲染物体和环境。支持 GDDR6 内存,与 GDDR5 内存相比,拥有 14 Gbps 传输速率,实现了 20%的的效率提升。NVLink2.0 支持 100 GB/s 双向带宽,使特定的工作负载能够有效地跨两个 GPU 进行分割并共享内存。
用户11307734
2024/11/27
3830
SuperEdge再添国产智能加速卡支持,为边缘智能推理再提速10倍
寒武纪 AE 团队,腾讯云容器中心边缘计算团队,SuperEdge 开发者 SuperEdge 支持国产智能加速卡寒武纪 MLU220 SuperEdge 对应的商业产品 TKE Edge 也一直在硬件和加速方面在持续耕耘,不但支持 NVIDIA 系列 GPU的加速,还在 GPU 虚拟,QGPU 化等方面持续发力。本次联合寒武纪对国产智能边缘加速卡进行了支持,以利于用户在边缘进行模型训练和边缘智能推理性能的提升。下面是经过寒武纪 AE 团队和 SuperEdge 开源团队的联合测试,对国产寒武纪边缘计算加
腾讯云原生
2021/11/23
7330
国产GPU厂商沐曦集成电路加入openKylin开源社区
3月13日消息,近日,沐曦集成电路 (上海) 有限公司(以下简称“沐曦”)签署 openKylin 社区 CLA(Contributor License Agreement 贡献者许可协议),正式加入 openKylin 开放麒麟开源社区。
芯智讯
2023/03/24
3950
国产GPU厂商沐曦集成电路加入openKylin开源社区
天数智芯:目标拿下NVIDIA中国区营收的10%!四季度将发首款7nm云端推理通用GPU“智铠100”
9月1日消息,在今日开幕的2022年世界人工智能大会(WAIC)上,国产GPU厂商天数智芯公布了国内首个通用计算应用开发及评测平台DeepSpark,以及旗下首款7nm制程的云端推理通用GPU芯片“智铠100”。
芯智讯
2022/09/07
9170
天数智芯:目标拿下NVIDIA中国区营收的10%!四季度将发首款7nm云端推理通用GPU“智铠100”
英伟达 H100 vs. 苹果M2,大模型训练,哪款性价比更高?
关键词:M2芯片;Ultra;M1芯片;UltraFusion;ULTRAMAN;RTX4090、A800;A100;H100;LLAMA、LM、AIGC、CHATGLM、LLVM、LLM、LLMs、GLM、NLP、ChatGPT、AGI、HPC、GPU、CPU、CPU+GPU、英伟达、Nvidia、英特尔、AMD、高性能计算、高性能服务器、蓝海大脑、多元异构算力、高性能计算、大模型训练、大型语言模型、通用人工智能、GPU服务器、GPU集群、大模型训练GPU集群、大语言模型
液冷服务器
2023/07/28
2.3K0
英伟达 H100 vs. 苹果M2,大模型训练,哪款性价比更高?
从最强AI算力到“元脑”2.0,智算加速产业变革
作者 | Just 出品 | AI科技大本营(ID:rgznai100) AI模型的数据量、结构的复杂程度不断增加,带来了大规模AI算力的庞大需求。 2020年7月,OpenAI实验室推出拥有1750亿参数的NLP模型GPT-3,其训练数据集规模超过500GB,算力需求达到了3640 Petaflop/s-day。2021年1月,Google Brain宣布他们设计的简化稀疏架构(Switch Transformer)可以将语言模型的参数量扩展到1.6 万亿,参数量是GPT-3的近10倍。要让这些模型有效有
AI科技大本营
2023/05/08
3390
从最强AI算力到“元脑”2.0,智算加速产业变革
台积电代工!Intel新AI PC芯片Lunar Lake发布:AI算力120TOPS!
6月4日,英特尔CEO帕特·基辛格在COMPUTEX 2024上发表主题演讲,正式公布了下一代面向AI PC的移动处理器Lunar Lake,不仅CPU、GPU、NPU性能全面提升,能耗也大幅降低,综合AI算力提升至120TOPS。
芯智讯
2024/06/07
1260
台积电代工!Intel新AI PC芯片Lunar Lake发布:AI算力120TOPS!
首款国产AI PC芯片正式发布:综合算力可达45TOPS!
7月30日,此芯科技在上海举行AI PC战略暨首款芯片发布会,正式发布了旗下首款AI PC芯片——此芯P1,综合AI算力可达45TOPS。
芯智讯
2024/08/01
2750
首款国产AI PC芯片正式发布:综合算力可达45TOPS!
英伟达A800也要禁售了?国产GPU厂商们准备好了吗
在没有获得许可证的情况下,美国商务部将禁止英伟达等制造商向中国客户运送AI芯片。英伟达专供中国的A800芯片,在无许可证的情况下也将被禁售。
数据猿
2023/09/27
1.1K0
英伟达A800也要禁售了?国产GPU厂商们准备好了吗
SuperEdge再添边缘智能加速卡,为边缘智能推理再提速10倍
寒武纪 AE 团队,腾讯云容器中心边缘计算团队,SuperEdge 开发者 SuperEdge 支持寒武纪边缘智能加速卡 MLU220 SuperEdge 对应的商业产品 TKE Edge 也一直在硬件和加速方面在持续耕耘,不但支持 NVIDIA 系列 GPU 的加速,还在GPU虚拟,QGPU 化等方面持续发力。本次联合寒武纪对边缘智能加速卡进行了支持,以利于用户在边缘进行模型训练和边缘智能推理性能的提升。下面是经过寒武纪 AE 团队和 SuperEdge 开源团队的联合测试,对寒武纪边缘智能加速卡兼容性
腾讯云原生
2021/12/03
5990
推荐阅读
相关推荐
对话沐曦AI解决方案总监虞新阳:不断迭代创新方能从市场中胜出
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档