首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何从CUDA11.4降级到10.2 &添加sm_35 - CUDA错误:没有内核映像可用于在设备上执行

从CUDA 11.4降级到10.2并添加sm_35的步骤如下:

  1. 首先,下载CUDA Toolkit 10.2的安装包。你可以在NVIDIA官方网站的开发者页面找到适用于你的操作系统的CUDA Toolkit 10.2版本。
  2. 在下载完成后,运行安装包并按照提示进行安装。确保选择正确的安装路径和组件。
  3. 安装完成后,打开命令行终端(Command Prompt)并导航到CUDA Toolkit 10.2的安装目录。默认情况下,安装路径为"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2"。
  4. 在命令行中,使用以下命令将CUDA环境变量添加到系统路径中:
  5. 在命令行中,使用以下命令将CUDA环境变量添加到系统路径中:
  6. 接下来,你需要修改你的CUDA项目的配置文件(例如CMakeLists.txt或者Makefile)以使用CUDA 10.2和sm_35架构。在配置文件中,将CUDA版本设置为10.2,并添加以下代码以支持sm_35架构:
  7. 接下来,你需要修改你的CUDA项目的配置文件(例如CMakeLists.txt或者Makefile)以使用CUDA 10.2和sm_35架构。在配置文件中,将CUDA版本设置为10.2,并添加以下代码以支持sm_35架构:
  8. 保存并关闭配置文件后,重新编译你的CUDA项目。确保编译过程中没有出现任何错误。

至此,你已经成功将CUDA版本从11.4降级到10.2,并添加了sm_35架构的支持。

关于CUDA错误"没有内核映像可用于在设备上执行",这通常是由于编译器无法找到适用于你的设备架构的内核映像所致。通过降级CUDA版本并添加适当的架构支持,你应该能够解决这个问题。

腾讯云相关产品和产品介绍链接地址:

  • 腾讯云GPU计算服务:https://cloud.tencent.com/product/gpu
  • 腾讯云容器服务:https://cloud.tencent.com/product/tke
  • 腾讯云函数计算:https://cloud.tencent.com/product/scf
  • 腾讯云人工智能平台:https://cloud.tencent.com/product/tai
  • 腾讯云物联网平台:https://cloud.tencent.com/product/iotexplorer
  • 腾讯云移动开发平台:https://cloud.tencent.com/product/mwp
  • 腾讯云对象存储:https://cloud.tencent.com/product/cos
  • 腾讯云区块链服务:https://cloud.tencent.com/product/tbaas
  • 腾讯云虚拟专用网络:https://cloud.tencent.com/product/vpc
  • 腾讯云安全产品:https://cloud.tencent.com/product/safe
页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • 充分利用NVIDIA Nsight开发工具发挥Jetson Orin的最大潜力

    Orin 架构以行业领先的性能为下一代边缘 AI 系统提供动力,该系统由 12 个 ARM Cortex A78 内核和 2 MB 三级缓存, NVIDIA Ampere 架构 GPU 提供 16 个流式多处理器或每个 SM 128 个 CUDA 内核的 SM,Orin 还具有用于工作负载的专用加速器,用于视频缩放、图像处理,还有光流加速器即OFA、2 个 JPEG 解码器、2 个深度学习加速器单元或支持张量 RT 的 DLA,用于深度学习操作,还有可编程视频加速器(PVA)和视频编解码引擎。Orin 使用高带宽 LPDDR5 内存,并具有一组丰富的 IO 连接选项,包括 22 个 PCI Express 通道、4 个千兆以太网连接器和 16 个 CSI 通道。凭借所有这些强大的功能,Jetson Orin 完全有能力应对边缘 AI 场景。

    04

    nvcc简介

    nvcc编译分成device部分编译和host部分编译,host部分直接调用平台编译器进行编译Linux使用gcc,window使用cl.exe,这里主要讲解device部分的编译,此部分编译分两个阶段,第一阶段将源文件.cu文件的device部分编译成ptx文本指令,第二阶段将ptx文本指令编译成在真实架构上运行的二进制指令,第二阶段可能发生在生成可执行程序的过程中,也可能发生在运行可执行程序的过程中(just-in-time compilation)。在生成可执行程序的过程中可以根据nvcc选项选择是否将ptx文本指令(x.ptx中间文件中)、二进制指令(x.cubin中间文件)嵌入到可执行程序中,一般有3种嵌入方式:只嵌入x.ptx(第二阶段被忽略,全部依赖just-in-time compilation);只嵌入x.cubin(无法进行just-in-time compilation);两者都嵌入(运行过程中driver找到合适二进制指令镜像则加载之,否则进行just-in-time compilation再加载之)。

    03

    【安装教程】Ubuntu16.04+Caffe+英伟达驱动410+Cuda10.0+Cudnn7.5+Python2.7+Opencv3.4.6安装教程

    对于caffe的安装过程,可以说是让我终身难忘。两个星期就为了一个caffe,这其中的心路历程只有自己懂。从实验室的低配置显卡开始装Ubuntu,到编译caffe,解决各种报错,这个过程花费了一周的时间。把cuda版本和N卡驱动版本一降再降,仍然不管用。因此手剁了一台8000的高配置主机。之后为了平衡实验室项目,首先花了半天时间将win10下的相关和其他杂七杂八的软件配置。只有以为只需Ubuntu安装好,caffe编译成功即可,不想安装完Ubuntu之后,却电脑没有引导启动项,把网上的方法试了个遍,却仍无法解决。因此听到一种说法是,win10的启动路径覆盖了Ubuntu启动路径。因此,决定重新再来,将自己的固态和机械全部初始化,首先在固态上安装Ubuntu16.04,在机械上安装Win10,对于双系统的安装请参照我的另一篇博客:Win10与Ubuntu16.04双系统安装教程。在这种情况下参加那个caffe安装成功。请注意,对于双系统建议先安装Ubuntu,并将caffe编译成功之后在去机械上安装Win10。Caffe的安装教程请参照如下安装教程。

    04
    领券