前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >原来你是这样的GPU卡|NVIDIA发布新一代Titan系列:Titan RTX

原来你是这样的GPU卡|NVIDIA发布新一代Titan系列:Titan RTX

作者头像
GPUS Lady
发布于 2018-12-24 08:38:24
发布于 2018-12-24 08:38:24
6.1K0
举报
文章被收录于专栏:GPUS开发者GPUS开发者

今天,NVIDIA发布了目前世界上最强大的桌面GPU卡—— Titan RTX™,该卡采用NVIDIA 图灵™架构,可提供130 Tflops 深度学习计算性能和11 GigaRays光线追踪性能。

NVIDIA TITAN RTX功能亮点:

  • 576个多精度Turing Tensor Cores,提供高达130万亿次的深度学习性能。
  • 72个Turing RT Cores,每秒提供多达11 GigaRays实时光线跟踪性能。
  • 24GB高速GDDR6内存,672GB/s带宽——是上一代泰坦gpu卡显存的两倍——以适应更大的模型和数据集。
  • 100GB/s NVIDIA NVLink可以对两个TITAN RTX gpu实现显存和计算能力的扩张。
  • 难以置信的性能和内存带宽可以实现实时8K视频编辑。
  • VirtualLink™接口提供了所需的性能和连接下一代VR耳机。

第三方媒体提供了一个规格比较图:

那么问题来了,到底该选择怎样的GPU卡用于深度学习?

RTX2080ti跟Titan RTX都采用了TU102芯片,但是比2080Ti多了256个SP (或者说都是TU102,但是2080Ti屏蔽了一些SP),比2080Ti占优势的一个最大亮点是——24GB大显存!以前双11GB显存的2080Ti 上NVLink是为了什么!现在直接双倍显存还多。价格2499美元,比买2个2080ti还便宜。

不过Titan RTX双精度计算能力很渣,看来Titan-V还能再战斗一段时间。

第三方媒体还公布了一个图来展现图灵架构Tensor Core的性能关系:

注意:Titan V没有NVLink ,没有二代的Tensor Core (INT8和INT4的巨大加速),显存容量还不如人家,唯一优势就是双精度计算,不过Titan-V是HBM(HBM2实际上),这显存省电的很。

网上有人测试过说2080Ti的Tensor Core,在FP16计算的时候,如果最后是累加FP32的话,只有一半性能。纯FP16计算2080Ti无此问题。而纯FP16,和FP16/FP32混合精度,Titan RTX都没这个问题。比较符合上图所描绘的情况。如果这个情况是属实,家用卡的RTX系列,Tensor Core被限定了在混合精度计算的时候,性能只有1/2的话,深度学习的开发者就真的只能用专业卡或者Titan RTX 。关于这一点我们目前还没有机会拿到这两种卡做测试。

总结:

(1)NV现在主要靠显存容量区分了。Titan RTX适合需要大容量显存的应用场合。

(2)相比之前的Titan-V,Titan RTX支持NVLink。这应该是目前能买到的比较实际的,能聚合成48GB总容量的卡了。(2080Ti才能聚合成22GB,而Titan-V不能聚合)

(3)计算性能几乎没啥增长。对于需要强力计算性能的人来说,可以考虑继续使用RTX 2080Ti的卡,就慢一点点。

(4)网上有谣传说是RTX 2080 Ti屏蔽掉了Tensor Core在特定情况下的1/2的计算性能。而Titan RTX无此影响。

(5)因为计算性能无增长(几乎),游戏玩家,以前玩不动的光追游戏,现在依然玩不动。可以继续等待下一代的卡。

(6)Titan RTX没有双精度,也没有低功耗的HBM2显存。是一个遗憾。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-12-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑
近期,AIGC领域呈现出一片繁荣景象,其背后离不开强大算力的支持。以ChatGPT为例,其高效的运行依赖于一台由微软投资建造的超级计算机。这台超级计算机配备了数万个NVIDIA A100 GPU,并利用60多个数据中心的数十万个GPU辅助,为ChatGPT提供了强大的算力支持。这种规模的算力部署不仅体现了AIGC技术的先进性,也预示着人工智能技术未来的发展趋势。这种集成了高性能计算、大数据处理和人工智能算法的超级计算机,将成为推动科技进步的重要引擎。
汀丶人工智能
2024/01/29
8.1K0
英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑
【AI系统】GPU 架构回顾(从2018年-2024年)
2018 年 Turing 图灵架构发布,采用 TSMC 12 nm 工艺,总共 18.6 亿个晶体管。在 PC 游戏、专业图形应用程序和深度学习推理方面,效率和性能都取得了重大进步。相比上一代 Volta 架构主要更新了 Tensor Core(专门为执行张量/矩阵操作而设计的专门执行单元,深度学习计算核心)、CUDA 和 CuDNN 库的不断改进,更好地应用于深度学习推理。RT Core(Ray Tracing Core)提供实时的光线跟踪渲染,包括具有物理上精确的投影、反射和折射,更逼真的渲染物体和环境。支持 GDDR6 内存,与 GDDR5 内存相比,拥有 14 Gbps 传输速率,实现了 20%的的效率提升。NVLink2.0 支持 100 GB/s 双向带宽,使特定的工作负载能够有效地跨两个 GPU 进行分割并共享内存。
用户11307734
2024/11/27
3840
深度学习GPU卡性能比拼:见证Titan RTX“钞能力”
文中,作者测试了包含Titan RTX在内的多个常见NVIDIA GPU卡在各种AI训练任务上的速度。对于每个GPU,分别训练下列神经网络时测量每秒处理的图像数量:ResNet50、ResNet152、Inception3、Inception4、VGG16、AlexNet和SSD。得出了一下结论:
GPUS Lady
2019/03/07
5K0
英伟达发布「霸王龙」Titan RTX:价格降低,本月上市
今年英伟达发布了新一代 GPU 架构 Turing 和 Quadro RTX 系列,然后又发布了三款消费级 GeForce RTX 显卡,以及第一款 Turing Tesla T4。然而,英伟达的产品线中通常会有一款比较高端的显卡,这就是 Titan。Titan 不是旗舰卡也不算是消费级显卡,但它仍然是英伟达产品中非常有趣的存在,它是最快的显卡,其他卡无法企及,现在它成为英伟达主推的工作站计算显卡。
机器之心
2018/12/24
1.2K0
英伟达发布「霸王龙」Titan RTX:价格降低,本月上市
NVIDIA推出全新GPU TITAN RTX,开源PhysX SDK
Turing提供动力的TITAN可提供130 teraflops的深度学习功能,11 gigarays的光线追踪性能,可满足全球最苛刻的用户需求。
AiTechYun
2018/12/24
8790
深度 | 英伟达深度学习Tensor Core全面解析
AI 科技评论消息,不久前,NVIDIA在SIGGRAPH 2018上正式发布了新一代GPU架构——Turing(图灵),黄仁勋称Turing架构是自2006年CUDA GPU发明以来最大的飞跃。Turing架构的两大重要特性便是集成了用于光线追踪的RT Core以及用于AI计算的Tensor Core,使其成为了全球首款支持实时光线追踪的GPU。
AI科技评论
2018/09/21
4.1K0
深度 | 英伟达深度学习Tensor Core全面解析
深度学习GPU卡鄙视链,你在第几层?
目前在售的NVIDIA Volta架构中Tesla V100处于深度学习GPU专业卡的最顶端位置!拥有5120个CUDA核心、640个Tensor辅助核心,核心面积达到了815平方毫米,集成了210亿个晶体管。作为Tesla P100的升级产品,Tesla V100同样拥有有两个不同的版本:一个是支持NVLInk,一个是支持PCIE。
GPUS Lady
2018/09/29
24.9K1
深度学习GPU卡鄙视链,你在第几层?
英伟达A100 GPU的核心数,Tesla系列
GeForce RTX是英伟达(NVIDIA)公司旗下的一个高端显卡系列。其中,“GeForce”是英伟达推出的显卡品牌,广泛应用于游戏、图形设计、视频编辑等多个领域,以其出色的图形处理能力和性能而著称。“RTX”则代表了该系列显卡所具备的特殊技术和功能,具体来说,“RTX”是Ray Tracing Texel eXtreme的缩写,意味着光线追踪技术的极致表现。
zhangjiqun
2024/07/31
6480
黄仁勋从煤气灶下取出最新GPU:7nm全新安培架构,售价20万美元,训练性能顶6张V100
因为美国疫情的原因,英伟达和其他科技公司一样,把今年的GPU技术大会(GTC 2020)改成线上举行。
量子位
2020/05/19
9510
黄仁勋从煤气灶下取出最新GPU:7nm全新安培架构,售价20万美元,训练性能顶6张V100
深度分析NVIDIA A100显卡架构(附论文&源码下载)
基于安培体系结构的NVIDIA A100 GPU是为了从其许多新的体系结构特征和优化中提供尽可能多的AI和HPC计算能力而设计的。在台积电7nm N7 FinFET制造工艺上,A100提供了比Tesla V100中使用的12nm FFN工艺更高的晶体管密度、更好的性能和更好的功率效率。一种新的Multi-Instance GPU(MIG)能为多租户和虚拟化GPU环境提供了增强的客户端/应用程序故障隔离和QoS,这对云服务提供商特别有利。一个更快和更强的错误抗力的第三代NVIDIA的NVLink互连提供了改进的多GPU性能缩放的超尺度数据中心。
计算机视觉研究院
2020/07/16
3.4K0
深度分析NVIDIA A100显卡架构(附论文&源码下载)
为什么说NVIDIA推出了史上最强的GPU?
8月14日早上北京时间7点,在SIGGRAPH 2018计算机图形与交互技术大会上,英伟达创始人兼CEO黄仁勋推出世界上第一款光线追踪GPU!据媒体报道老黄把这块GPU称作”自2006年以来最重要的一块GPU“,耗时10年打造。
GPUS Lady
2018/08/17
1.3K0
为什么说NVIDIA推出了史上最强的GPU?
英伟达机器学习5大网红GPU卡
除了高性能计算,GPU自身具备的高并行度、矩阵运算与强大的浮点计算能力非常符合深度学习的需求。它可以大幅加速深度学习模型的训练,在相同精度下能提供更快的处理速度、更少的服务器投入以及更低的功耗。小编结合工作中客户咨询的经验,总结出英伟达5大热门机器学习用GPU卡。 第五名:Tesla K80   Tesla ——英伟达高端大气上档次专用计算卡品牌,以性能高、稳定性强,适用于长时间高强度计算著称。 Tesla K80 双GPU 加速器可透过一卡双 GPU 提供双倍传输量,内置24G
GPUS Lady
2018/03/30
10.3K0
英伟达机器学习5大网红GPU卡
史上最完整的GPU卡Tensonflow性能横向评测
1.RTX Titan具有良好的fp32和fp16计算性能。它的特点类似于RTX 2080Ti,但它有两倍的内存和更好的性能。
GPUS Lady
2019/03/07
2.9K0
一台优秀的GPU服务器是什么样子的?
到年底了,又到了各大高校开始动手采购GPU服务器的时候到了,最近不少学生在QQ上请我们帮忙看看配置
GPUS Lady
2019/12/10
7.2K0
一台优秀的GPU服务器是什么样子的?
在NIPS 2017发布Titan V:首次搭载Volta的消费级GPU | 快讯
NIPS 2017 正在美国举办,白天的精彩不断,晚上也有人搞事情:12 月 7 日,在白天的正会结束之后,黄仁勋在旁边的希尔顿酒店开了个 party。 「前半小时是一般的吃饭聊天,然后老黄上场,借着发奖的名义把 Rus,Yoshua 等大佬都拉上台走了一圈,以显示趴体的逼格。到这里都算正常,然后爆炸的就来了。一段炫酷视频后,老黄发布了 Titan V,volta 版 Titan。」party 现场的解浚源同学如是说道。 据悉,NVIDIA Titan V 集成了英伟达最新一代 GPU 技术——Volta
AI研习社
2018/03/16
6330
在NIPS 2017发布Titan V:首次搭载Volta的消费级GPU | 快讯
【AI系统】GPU 架构回顾(从2010年-2017年)
1999 年,英伟达发明了 GPU(graphics processing unit),本文将介绍英伟达 GPU 从 Fermi 到 Blackwell 共 9 代架构,时间跨度从 2010 年至 2024 年,具体包括费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pashcal)、伏特(Volt)、图灵(Turing)、安培(Ampere)和赫柏(Hopper)和布莱克韦尔(Blackwell)架构。经过 15 年的发展,CUDA 已成为英伟达的技术“护城河”,Tensor Core5.0,NVLink5.0,NVswitch4.0,Transformer Engine2.0 等技术迭代更新,正如英伟达公司官方宣传语所言:“人工智能计算领域的领导者,推动了 AI、HPC、游戏、创意设计、自动驾驶汽车和机器人开发领域的进步。”
用户11307734
2024/11/27
3230
如何为深度学习选择最佳 GPU ?
Hello folks,我是 Luga,今天我们继续来聊一下人工智能生态相关技术 - 用于加速构建 AI 核心算力的 GPU 硬件技术。
Luga Lee
2024/11/18
6610
如何为深度学习选择最佳 GPU ?
新显卡出世,我们来谈谈与深度学习有关的显卡架构和相关技术
可以说是万众期待下,老黄发布了消费级(民用级)显卡RTX2070、RTX2080、RTX2080TI,作为“大多数人”,不得不说在发布会即将结束的那一刻,真的很想预订一块。真的很有诱惑力啊,毕竟价格摆在那里,RTX2080TI显卡相比1080TI可是贵了许多,Founder Edition 版 京东上预订9999差不多1w了。
老潘
2018/08/30
3.6K0
新显卡出世,我们来谈谈与深度学习有关的显卡架构和相关技术
人工智能研究者应该选择哪款显卡?
我在自己的网站中专门介绍过GPU的一些硬件基础知识:https://lulaoshi.info/gpu/gpu-basic/gpu.html。英伟达为优化深度学习的矩阵运算,在较新的微架构中,专门设计了Tensor Core这样的混合精度核心,因此,人工智能训练最好选择带有Tensor Core的GPU。
PP鲁
2020/06/29
3.2K0
英伟达的这款GPU太强了!
今年 3 月 21 日 - 24 日举办的 NVIDIA GTC 2022 大会可谓是亮点十足。NVIDIA 不仅一口气更新了 60 多个 SDK 应用程序,继续加大在 Omniverse、机器人平台、自动驾驶和量子计算等领域中的布局 ,还重磅发布了基于全新 Hopper 架构的 H100 GPU!
Amusi
2022/06/13
1.5K0
英伟达的这款GPU太强了!
推荐阅读
相关推荐
英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档