首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >>=:如何检测计算能力为CUDA 7.2的设备上的共享内存条冲突?

>=:如何检测计算能力为CUDA 7.2的设备上的共享内存条冲突?
EN

Stack Overflow用户
提问于 2019-03-22 10:10:16
回答 2查看 839关注 0票数 2

在具有计算能力<= 7.2的设备上,我总是使用

nvprof --events shared_st_bank_conflict

但是当我用CUDA10在RTX2080ti上运行它时,它返回

Warning: Skipping profiling on device 0 since profiling is not supported on devices with compute capability greater than 7.2

那么,我如何检测此设备上是否存在共享内存库冲突?

我已经安装了Nvidia Nsight Systems和Nsight,找不到这样的分析报告...

非常感谢

EN

回答 2

Stack Overflow用户

发布于 2019-03-22 18:53:03

这似乎是一个问题,并在this帖子中提到了NVIDIA论坛。显然,应该使用Nsight工具之一( CLI或UI)来支持它。

票数 1
EN

Stack Overflow用户

发布于 2020-02-16 22:09:14

您可以使用--metrics

任一

代码语言:javascript
运行
AI代码解释
复制
nv-nsight-cu-cli --metrics l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_ld.sum

用于从共享内存读取(加载)时的冲突,或者

代码语言:javascript
运行
AI代码解释
复制
nv-nsight-cu-cli --metrics l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_st.sum

用于在写入(存储)到共享内存时发生冲突。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55297281

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档