Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >RTX 3080 LHR缺失gpu__dram_throughput CUDA度量

RTX 3080 LHR缺失gpu__dram_throughput CUDA度量
EN

Stack Overflow用户
提问于 2022-01-13 04:45:13
回答 2查看 403关注 0票数 0

作为机器学习项目的一部分,我们正在优化一些定制的CUDA内核。

我们试图使用Nsight Compute对它们进行分析,但是在运行CUDA内核的简单包装程序时,在LHR RTX 3080上运行以下错误:

代码语言:javascript
运行
AI代码解释
复制
==ERROR== Failed to access the following 4 metrics: dram__cycles_active.avg.pct_of_peak_sustained_elapsed, dram__cycles_elapsed.avg.per_second, gpu__compute_memory_throughput.avg.pct_of_peak_sustained_elapsed, gpu__dram_throughput.avg.pct_of_peak_sustained_elapsed

==ERROR== Failed to profile kernel "kernel" in process 20204

通过nv-nsight-cu-cli --devices 0 --query-metrics运行对RTX 3080 TI (非LHR )和RTX-3080 (LHR)上可用的指标的差异,我们注意到在RTX 3080 LHR版本中缺少以下指标:

代码语言:javascript
运行
AI代码解释
复制
gpu__compute_memory_request_throughput
gpu__compute_memory_throughput
gpu__dram_throughput

所有这些都是使用Nsight Compute进行基本内存分析所必需的。除了这些指标之外,所有其他指标都是正确的。这是LHR卡的限制吗?他们为什么不在场?

详细信息:

  • 千兆字节RTX 3080 Turbo (LHR)
  • Cuda版本:11.5
  • 驱动程序版本:
  • 10
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-01-20 10:21:32

根据Nvidia论坛,这是一个意外的错误,它是通过从CUDA 11.5升级到CUDA 11.6来修复的,在此基础上,所有分析都与所有可用的指标正确工作。

成功条件:

  • 千兆字节RTX 3080 Turbo (LHR)
  • Cuda版本:11.6
  • 驱动程序版本:

10

我们不知道为什么这些指标不可用,但是版本更新绝对是正确的修正。

票数 0
EN

Stack Overflow用户

发布于 2022-01-20 04:49:41

我在nvidia开发者论坛上看到了你的文章,从它的外观来看,nvidia并不打算这样做,所以我要么现在就去做什么(非lhr),直到他们修复它。Quadro和tesla卡是由Nsight Compute支持的,因此它们可能是一个保持不变的解决方案。

因此,要回答主要问题:

会购买一个非LHR GPU来解决这个问题吗?

就目前而言,是的,购买非lhr 3080应该可以解决这个问题。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/70696846

复制
相关文章
英伟达算法遭破解,RTX30系恢复100%挖矿算力:显卡降价结束了?
机器之心报道 编辑:泽南 这样下来,GPU的价格会涨还是会跌? 因为GPU挖矿而被美国证监会罚款的英伟达,最近又遇到了新麻烦:他们的加密算法被破解了。 因为潜在的利益驱动,当英伟达在安培架构显卡上提出哈希锁(LHR)时,我们知道有人破解它只是时间问题。近日,设计QuickMiner软件和矿机的公司NiceHash宣布英伟达的算法已被破解,被LHR加锁的GPU现在恢复了100%的以太坊(Ethereum,ETH)挖矿性能。 英伟达的GPU不仅被广泛应用于深度学习和游戏、设计等领域,而且也一直被加
机器之心
2022/05/10
3610
英伟达算法遭破解,RTX30系恢复100%挖矿算力:显卡降价结束了?
RTX 3090,3080,3070安装 TensorFlow & PyTorch
目前(至11/7/2020)我们还无法在英伟达 RTX 30 系列 GPU(Ampere)上通过 pip/conda 安装 TensorFlow 或 PyTorch。因为这些 GPU 需要 CUDA 11.1,而当前主流的 TensorFlow/PyTorch 版本不是针对 CUDA 11.1 编译的。现在要在 30XX GPU 上运行这些库的话只能手动编译或者用英伟达 docker 容器。
McGL
2020/11/10
3.6K0
英伟达发布12G显存版3080!AI超级分辨率:1080p帧数、4K画质
Tom's Hardware高级编辑Brandon Hill表示:「事实上,我们对这个产品的发布感到有点惊讶,这显然也是由英伟达的合作伙伴驱动的。」
新智元
2022/02/24
1.1K0
英伟达发布12G显存版3080!AI超级分辨率:1080p帧数、4K画质
“黄仁勋不仁不义”!挖矿限制被100%破解,显卡价格应声而涨,网友们都怒了
梦晨 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 坏了坏了,一觉醒来,“等等党们”发现购物车里的显卡价格又涨了。 3080TI涨幅最大,比昨天高400左右,3060TI以及3070TI也涨了100-300不等。 啊这,说好的“你,我,200”呢???(你不买,我不买,明天还要降200) 赶紧查了一下新闻,居然是英伟达显卡限制挖矿算力哈希锁被完全破解。 这一次,RTX 30系几乎全系沦陷,恢复100%算力。 根据破解团队Nicehash放出的截图,3080TI已恢复120MH/s,与无锁的数据一致
量子位
2022/05/10
8040
“黄仁勋不仁不义”!挖矿限制被100%破解,显卡价格应声而涨,网友们都怒了
英伟达RTX 4070最新测评来了!光追效果更棒,但仅限于2k游戏
萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 英伟达RTX 4070开卖,4799元的价格也是让不少人心动。 由于之前矿难一波,英伟达30系显卡失去了不少人的信任,大伙儿的目光也都放在了40系显卡上。 现在4070性价比卡终于姗姗来迟,它实际性能究竟如何,是否真值得上手? 现在,The Verge发布了最新一期测评,就16款常玩游戏的不同帧率和分辨率给出了性能测评效果。 先说省流结论: 开启DLSS的性能更好,玩2K游戏更稳定,功耗更低,但玩4K游戏不行。 来看看这波详细测评结果。 DLSS 3
量子位
2023/05/06
2870
英伟达RTX 4070最新测评来了!光追效果更棒,但仅限于2k游戏
电脑显卡的性能-2021年显卡性能排名前十 目前最好的显卡 2021显卡性能天梯
  目前最好的显卡排名,排在第一位的NVIDIA RTX 3090是现如今市面上性能最强的显卡,强的一塌糊涂,24GB的内存,支持8K分辨率,世上首款8K游戏显卡,核心是GA102,完整版的GA102核心有10752个流处理器,相当于Titan RTX的2.33倍,对比20系提升巨大,3090相比3080提升了15%左右,相比2080ti提升在43%左右,不论什么样的游戏都能完美的驾驭,不愧被称为地球最强。不过值得注意的是,RTX 3090是一块非常耗电的卡,并且需要一个体面的电源设备;在一个就是价格非常昂贵,让一般游戏玩家难以企及。
宜轩
2022/12/26
2.3K0
用动画在老黄的厨房搞小动作?「AI Tuber」除了配音还能编曲?这次除了显卡都是干货
---- 新智元报道   来源:Computex NVIDIA 编辑:好困 Emil 【新智元导读】「不务正业」的英伟达在AI上简直是大力出奇迹,不仅带来了AI动画制作软件,还有基于AI的实时3D仿真软件,甚至连「AI Tuber」都搞了出来。当然,除此之外,英伟达也为我们带来了「买不到」的3080Ti和3070Ti。 英伟达终于发布了GeForce RTX 3080 Ti,然而这一点儿都不重要。看完之后发现明显是那个「AITuber」旁白更有意思,是真的可爱! 刚开始还在想这个配音还有些生涩,结果没
新智元
2023/05/22
2720
用动画在老黄的厨房搞小动作?「AI Tuber」除了配音还能编曲?这次除了显卡都是干货
英伟达发布4090超级核弹!台积电4nm,顶配12999元起,性能暴涨4倍
---- 新智元报道   编辑:编辑部 【新智元导读】英伟达40系显卡终于来了,看完发布会的发烧友们,纷纷表示自己30系还能再战三年。 在全球DIY玩家们喜迎矿难、30系显卡价崩之际,在「你,我,200,飞」成真的大喜氛围中,英伟达矿业集团(bushi)一年一度的盛会GTC 2022如期而至! 昨天晚上,老黄穿着那件万年不变的皮衣,发布了玩家们期盼已久的40系显卡: 24GB显存的RTX 4090,以及16GB和12GB显存的RTX 4080,代号「Ada」。 不用说,发烧友们最先关心的就是卖多少钱
新智元
2022/09/22
7720
英伟达发布4090超级核弹!台积电4nm,顶配12999元起,性能暴涨4倍
被老黄撤回的RTX4080 12G要改名4070TI,网友:少扯虚的,不降价谁买?
还记得英伟达仅发布不到一个月,就被网友活活「骂到取消」的RTX4080 12G版吗?
新智元
2023/01/07
4050
被老黄撤回的RTX4080 12G要改名4070TI,网友:少扯虚的,不降价谁买?
英伟达RTX 4080测评:4K游戏帧率完胜30系列,最大槽点:不值
英伟达40系列的RTX 4080从11月16日起正式发售,显存只有一种大小:16GB。
量子位
2022/12/09
7600
英伟达RTX 4080测评:4K游戏帧率完胜30系列,最大槽点:不值
用动画在老黄的厨房搞小动作?「AI Tuber」除了配音还能编曲?这次除了显卡都是干货
英伟达终于发布了GeForce RTX 3080 Ti,然而这一点儿都不重要。看完之后发现明显是那个「AITuber」旁白更有意思,是真的可爱!
代码医生工作室
2021/06/15
8400
用动画在老黄的厨房搞小动作?「AI Tuber」除了配音还能编曲?这次除了显卡都是干货
英伟达RTX 40系列显卡发布!还有最强汽车芯片Thor:算力高达2000TFLOPS!
9月20日晚间,英伟达(NVIDIA)正式发布了全新的RTX 40系列显卡,首发推出的有三款型号,分别是RTX 4090、RTX 4080 16GB、RTX 4080 12GB,将于10月12日上市,建议零售价12999元起。
芯智讯
2022/09/27
1.3K0
英伟达RTX 40系列显卡发布!还有最强汽车芯片Thor:算力高达2000TFLOPS!
英伟达新卡皇3090Ti:功耗飙至450W换来性能涨11%
就在正在召开的CES 2022上,英伟达推出了比“性能猛兽”3090更强悍的新一代旗舰显卡GeForce RTX 3090 Ti。
量子位
2022/01/14
9880
英伟达新卡皇3090Ti:功耗飙至450W换来性能涨11%
Ubuntu 20.04 LTS/RTX30XX显卡 快速配置深度学习环境(一行命令)
近日,新入一台RTX3080的服务器,目前好像还没办法很方便地在 RTX 30 系列 GPU上通过 pip/conda 安装 TensorFlow 或 PyTorch。因为这些 GPU 需要 CUDA 11.1,而当前主流的 TensorFlow/PyTorch 版本不是针对 CUDA 11.1 编译的。现在要在 30XX GPU 上运行这些库的话,需要很强的动手能力,手动编译或者用英伟达 docker 容器。
黄博的机器学习圈子
2020/12/11
2.9K0
Ubuntu 20.04 LTS/RTX30XX显卡 快速配置深度学习环境(一行命令)
Llama-2 推理和微调的硬件要求总结:RTX 3080 就可以微调最小模型
大语言模型微调是指对已经预训练的大型语言模型(例如Llama-2,Falcon等)进行额外的训练,以使其适应特定任务或领域的需求。微调通常需要大量的计算资源,但是通过量化和Lora等方法,我们也可以在消费级的GPU上来微调测试,但是消费级GPU也无法承载比较大的模型,经过我的测试,7B的模型可以在3080(8G)上跑起来,这对于我们进行简单的研究是非常有帮助的,但是如果需要更深入的研究,还是需要专业的硬件。
deephub
2023/09/14
7K0
Llama-2 推理和微调的硬件要求总结:RTX 3080 就可以微调最小模型
炼丹志 | 2021显卡挑选指南
来源丨https://zhuanlan.zhihu.com/p/365926059
公众号机器学习与AI生成创作
2021/07/05
1.8K0
英伟达公布 RTX 4080 游戏测试数据:16G 型号性能超 12G 24-30%
IT之家 10 月 12 日消息,据 VideoCardz 消息,在 RTX 4090 上市之际,英伟达分享了 RTX 4090、4080 16G 和 4080 12G 在三款游戏中的帧率表现。
帝旭科技
2022/11/23
4470
英伟达公布 RTX 4080 游戏测试数据:16G 型号性能超 12G 24-30%
老黄没来!英伟达祭出GPU之王RTX 3090Ti,元宇宙平台开放
这不,全能性价比的GPU之王RTX 3050来了,仅要249美元,不仅能60fps畅玩3A游戏,还支持DLSS。
新智元
2022/02/24
7050
老黄没来!英伟达祭出GPU之王RTX 3090Ti,元宇宙平台开放
四插槽庞大体积、功耗最高600W,英伟达RTX 4090 Ti谍照再现身
今年 1 月,数码博主 MEGAsizeGPU 就放出了一款四槽厚的英伟达公版显卡实物图,并认为它是「4090Ti/Titan Ada」。当时称最高功耗可以达到恐怖的 900W。下图为泄露的 Titan RTX Ada 四插槽散热器。
机器之心
2023/08/07
4220
四插槽庞大体积、功耗最高600W,英伟达RTX 4090 Ti谍照再现身
CES 2021 三强「争霸」:AMD、英特尔、英伟达各显神通
13日,AMD、英特尔、英伟达各自开了一场线上发布会,新品有点多,绝对有你喜欢的一款,我们慢慢梳理。
新智元
2021/01/25
4800

相似问题

带有RTX 3080的CUDA 11是否支持tensorflow和keras?

1105

WSL2 Pytorch RuntimeError: RTX3080没有任何CUDA GPU可用

521

基于OpenCL RTX3080的立方体光栅优化算法

15

RTX A5000的CUDA优化

17

在RTX 3080上使用ffmpeg进行h264编码失败

19
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档