在具有计算能力<= 7.2的设备上,我总是使用
nvprof --events shared_st_bank_conflict
但是当我用CUDA10在RTX2080ti上运行它时,它返回
Warning: Skipping profiling on device 0 since profiling is not supported on devices with compute capability greater than 7.2
那么,我如何检测此设备上是否存在共享内存库冲突?
我已经安装了Nvidia Nsight Systems和Nsight,找不到这样的分析报告...
非常感谢
发布于 2019-03-22 18:53:03
这似乎是一个问题,并在this帖子中提到了NVIDIA论坛。显然,应该使用Nsight工具之一( CLI或UI)来支持它。
发布于 2020-02-16 22:09:14
您可以使用--metrics
任一
nv-nsight-cu-cli --metrics l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_ld.sum
用于从共享内存读取(加载)时的冲突,或者
nv-nsight-cu-cli --metrics l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_st.sum
用于在写入(存储)到共享内存时发生冲突。
https://stackoverflow.com/questions/55297281
复制