当我试图通过Nvidia的OpenACC分析器运行一个与nvprof
一起开发的程序时,我得到了这样的信息:
nvprof ./SFS 4
如果我使用nvprof
运行-o [output_file]
,则不会出现警告消息,但不会创建输出文件。这里有什么问题吗?
LD_LIBRARY_PATH
在我的.bashrc
中设置为:/opt/nvidia/hpc_sdk/Linux_x86_64/20.7/cuda/11.0/lib64/
,因为我在那里找到了这些文件(它们的名字中有"cupti“和"inj”,我认为它们是必需的):
lrwxrwxrwx 1 root root 19 Aug 4 05:27 libaccinj64.so -> libaccinj64.so.11.0
lrwxrwxrwx 1 root root 23 Aug 4 05:27 libaccinj64.so.11.0 -> libaccinj64.so.11.0.194
...
lrwxrwxrwx 1 root root 16 Aug 4 05:27 libcupti.so -> libcupti.so.11.0
lrwxrwxrwx 1 root root 20 Aug 4 05:27 libcupti.so.11.0 -> libcupti.so.2020.1.0
...
我在Ubuntu 18.04。工作站与Nvidia GeForce RTX 2070,并安装了CUDA版本11。
nvidia-smi
命令提供了以下内容:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.66 Driver Version: 450.66 CUDA Version: 11.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce RTX 2070 Off | 00000000:02:00.0 On | N/A |
| 30% 40C P2 58W / 185W | 693MiB / 7981MiB | 3% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
我拥有的编译器(nvidia和波特兰)来自最新的Nvidia HPC-SDK,版本20.7-0。
我用-acc -Minfo=accel
选项编译我的程序,不确定如何设置-ta=
,以及是否需要它?
我也不确定是否运行我的代码,无论nvprof
是否使用GPU,尽管我确实将ACC_DEVICE_TYPE
设置为nvidia
。
任何建议都是非常欢迎的。
干杯
发布于 2020-09-24 07:54:13
你用的是哪一种?与NV HPC 20.7或您自己安装的?
这看起来非常类似于昨天在NVIDIA DevTalk用户论坛上报道的一个问题:
https://forums.developer.nvidia.com/t/new-20-7-version-where-is-the-detail-release-bugfix/146168/4
当然,这是对Nsight系统来说的,但也可能是同样的问题。这似乎是一个问题的2020.3版本的分析器,这是版本,我们附带的NVHPC20.7 SDK。正如我所注意到的,Nsight-Systems 2020.4发行版应该有这个固定版本,所以需要下载和安装2020.4,或者使用以前的版本。
https://developer.nvidia.com/nsight-systems
Nsight系统的下载似乎有一个暂时的问题,希望在你看到这份说明之前就能得到修正。
另外,nvprof正在被废弃,所以您应该考虑使用Nsight-system和Nsight-compute。
https://developer.nvidia.com/blog/migrating-nvidia-nsight-tools-nvvp-nvprof/
https://stackoverflow.com/questions/64044553
复制相似问题