前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【2022超详细版】Win10安装cuda(10.1、11.7)+cuDNN(7.6.5、8.5.0)+tensorflow(gpu版)+pytorch(gpu版)

【2022超详细版】Win10安装cuda(10.1、11.7)+cuDNN(7.6.5、8.5.0)+tensorflow(gpu版)+pytorch(gpu版)

作者头像
Qomolangma
发布2024-07-30 08:15:02
1.5K0
发布2024-07-30 08:15:02
举报
文章被收录于专栏:深度学习

1.查看显卡支持的CUDA版本

查看版本

Release Notes :: CUDA Toolkit Documentation (nvidia.com)

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

根据数值选择相应cuda版本

2.安装CUDA

官网

从NVIDIA官方网站上下载适合你系统的CUDA Toolkit安装包。

CUDA Toolkit Archive | NVIDIA Developer

https://developer.nvidia.com/cuda-toolkit-archive

10.1版本可全装其他盘,11.7版本会有2个多G固定装在C盘

10.1版本

1. 下载地址

CUDA Toolkit 10.1 original Archive | NVIDIA Developer

https://developer.nvidia.com/cuda-10.1-download-archive-base?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal

2. 安装过程

根据CUDA Toolkit的安装向导,选择适合你的选项进行安装,可以根据你的需求进行自定义安装。

  • 双击.exe进行安装
  • 临时文件,安装后自动清除

默认C盘,建议更改到D盘如图所示目录,便于后续添加环境变量

3. 将CUDA的路径添加到环境变量中

安装完成,需要将CUDA的路径添加到你的系统环境变量中。在Windows操作系统上,可以通过右键点击"计算机"(或"此电脑")-> 属性 -> 高级系统设置 -> 环境变量,在系统变量中找到"Path"变量并添加CUDA的安装路径。

新建如下环境变量,自己根据实际情况进行修改

代码语言:javascript
复制
D:\CUDA\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib\x64

D:\CUDA\NVIDIA GPU Computing Toolkit\CUDA\v10.1\include

D:\CUDA\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\CUPT\lib64

D:\CUDA\NVIDIA Corporation\CUDA Samples\v10.1\bin\win64

D:\CUDA\NVIDIA Corporation\CUDA Samples\v10.1\common\lib\x64

(可选择新建,亦可选择“浏览”找到相应文件夹)

11.7版本与10.1有区别的部分

11.7安装过程可参照前文,这里仅介绍有区别的部分

1. 安装位置

缺NVIDIA Corporation的(2个多G)固定装在C盘

2. 默认添加环境变量

不需要手动添加环境变量

检验安装

代码语言:javascript
复制
nvcc -V
代码语言:javascript
复制
set cuda

卸载CUDA

卸载框选的4个:

3.下载cuDNN

CUDA10.1版本+cuDNN7.6.5

  1. 官网下载(需要先注册)cuDNN Archive | NVIDIA Developer

https://developer.nvidia.com/rdp/cudnn-archive

下载后,解压,然后将bin、include、lib文件夹下的文件直接复制到CUDA安装目录中的对应位置。

CUDA11.7版本+cuDNN8.5.0

检验是否安装成功

代码语言:javascript
复制
bandwidthTest.exe

"bandwidthTest.exe"用于测试CUDA设备的内存带宽。运行此可执行文件将显示出设备的内存读取和写入带宽信息,以及带宽测试的结果。这对于评估设备的性能和了解其内存访问速度非常有用。

代码语言:javascript
复制
deviceQuery.exe

"deviceQuery.exe"用于查询CUDA设备的属性和功能。运行此可执行文件将显示出设备的名称、计算能力、CUDA核心数量、内存总量、内存时钟频率等信息,以及设备支持的CUDA功能和特性。这对于了解设备的硬件规格和功能非常有用。

4.安装tensorflow_gpu

1. 版本匹配问题,这里使用python3.7

代码语言:javascript
复制
python -m site

显示Python解释器搜索模块的目录列表,以及Python的安装信息和配置文件位置。

2. 安装命令

代码语言:javascript
复制
conda install tensorflow-gpu==2.3.0

亦可使用pip命令

3. 运行报错及解决方案

①报错

代码语言:javascript
复制
AttributeError: module 'tensorflow.python.framework.ops' has no attribute '_TensorLike'

②报错

2022-11-22 19:57:04.351092: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN)to use the following CPU instructions in performance-critical operations: AVX AVX2

To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.

代码语言:javascript
复制
2022-11-22 19:57:04.351092: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN)to use the following CPU instructions in performance-critical operations:  AVX AVX2

To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.

这个报错信息表明你的TensorFlow二进制文件是经过优化的,使用了oneAPI Deep Neural Network Library (oneDNN)来在性能关键的操作中使用特定的CPU指令,包括AVX和AVX2。 然而,这个优化只适用于一些性能关键的操作,对于其他操作可能并没有启用这些指令。如果你希望在其他操作中也启用这些指令,你需要重新编译TensorFlow,并使用相应的编译器标志来启用AVX和AVX2指令集。

AVX(Advanced Vector Extensions-Intel® AVX) 是intel 优化CPU用于浮点计算的技术,如果有GPU了,其实不用考虑该警告讯息。 不过, 不管怎么说, 如果不愿意看到该警告讯息, 可以加上如下2行代码:

代码语言:javascript
复制
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

该代码是用来设置TensorFlow的日志级别的。通过设置os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2',将日志级别设置为最低级别,即只显示错误信息,不显示其他日志信息。这可以帮助减少不必要的日志输出,使程序的运行输出更加简洁。

5.安装pytorch_gpu

查看版本匹配

Previous PyTorch Versions | PyTorch

https://pytorch.org/get-started/previous-versions/

10.1

1. pip安装
代码语言:javascript
复制
pip install torch==1.8.1+cu101 torchvision==0.9.1+cu101 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html
2. conda安装
代码语言:javascript
复制
conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.1 -c pytorch

11.7

代码语言:javascript
复制
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-08-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.查看显卡支持的CUDA版本
    • 查看版本
    • 2.安装CUDA
      • 官网
        • 10.1版本
          • 1. 下载地址
          • 2. 安装过程
          • 3. 将CUDA的路径添加到环境变量中
        • 11.7版本与10.1有区别的部分
          • 1. 安装位置
          • 2. 默认添加环境变量
        • 检验安装
          • 卸载CUDA
          • 3.下载cuDNN
            • CUDA10.1版本+cuDNN7.6.5
              • CUDA11.7版本+cuDNN8.5.0
                • 检验是否安装成功
                • 4.安装tensorflow_gpu
                  • 1. 版本匹配问题,这里使用python3.7
                    • 2. 安装命令
                      • 3. 运行报错及解决方案
                      • 5.安装pytorch_gpu
                        • 查看版本匹配
                          • 10.1
                            • 1. pip安装
                            • 2. conda安装
                          • 11.7
                          相关产品与服务
                          GPU 云服务器
                          GPU 云服务器(Cloud GPU Service,GPU)是提供 GPU 算力的弹性计算服务,具有超强的并行计算能力,作为 IaaS 层的尖兵利器,服务于生成式AI,自动驾驶,深度学习训练、科学计算、图形图像处理、视频编解码等场景。腾讯云随时提供触手可得的算力,有效缓解您的计算压力,提升业务效率与竞争力。
                          领券
                          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档