Release Notes :: CUDA Toolkit Documentation (nvidia.com)
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
根据数值选择相应cuda版本
从NVIDIA官方网站上下载适合你系统的CUDA Toolkit安装包。
CUDA Toolkit Archive | NVIDIA Developer
https://developer.nvidia.com/cuda-toolkit-archive
10.1版本可全装其他盘,11.7版本会有2个多G固定装在C盘
CUDA Toolkit 10.1 original Archive | NVIDIA Developer
根据CUDA Toolkit的安装向导,选择适合你的选项进行安装,可以根据你的需求进行自定义安装。
默认C盘,建议更改到D盘如图所示目录,便于后续添加环境变量
安装完成,需要将CUDA的路径添加到你的系统环境变量中。在Windows操作系统上,可以通过右键点击"计算机"(或"此电脑")-> 属性 -> 高级系统设置 -> 环境变量,在系统变量中找到"Path"变量并添加CUDA的安装路径。
新建如下环境变量,自己根据实际情况进行修改
D:\CUDA\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib\x64
D:\CUDA\NVIDIA GPU Computing Toolkit\CUDA\v10.1\include
D:\CUDA\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\CUPT\lib64
D:\CUDA\NVIDIA Corporation\CUDA Samples\v10.1\bin\win64
D:\CUDA\NVIDIA Corporation\CUDA Samples\v10.1\common\lib\x64
(可选择新建,亦可选择“浏览”找到相应文件夹)
11.7安装过程可参照前文,这里仅介绍有区别的部分
缺NVIDIA Corporation的(2个多G)固定装在C盘
不需要手动添加环境变量
nvcc -V
set cuda
卸载框选的4个:
https://developer.nvidia.com/rdp/cudnn-archive
下载后,解压,然后将bin、include、lib文件夹下的文件直接复制到CUDA安装目录中的对应位置。
bandwidthTest.exe
"bandwidthTest.exe"用于测试CUDA设备的内存带宽。运行此可执行文件将显示出设备的内存读取和写入带宽信息,以及带宽测试的结果。这对于评估设备的性能和了解其内存访问速度非常有用。
deviceQuery.exe
"deviceQuery.exe"用于查询CUDA设备的属性和功能。运行此可执行文件将显示出设备的名称、计算能力、CUDA核心数量、内存总量、内存时钟频率等信息,以及设备支持的CUDA功能和特性。这对于了解设备的硬件规格和功能非常有用。
python -m site
显示Python解释器搜索模块的目录列表,以及Python的安装信息和配置文件位置。
conda install tensorflow-gpu==2.3.0
亦可使用pip命令
①报错
AttributeError: module 'tensorflow.python.framework.ops' has no attribute '_TensorLike'
改
②报错
2022-11-22 19:57:04.351092: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN)to use the following CPU instructions in performance-critical operations: AVX AVX2
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.
2022-11-22 19:57:04.351092: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN)to use the following CPU instructions in performance-critical operations: AVX AVX2
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.
这个报错信息表明你的TensorFlow二进制文件是经过优化的,使用了oneAPI Deep Neural Network Library (oneDNN)来在性能关键的操作中使用特定的CPU指令,包括AVX和AVX2。 然而,这个优化只适用于一些性能关键的操作,对于其他操作可能并没有启用这些指令。如果你希望在其他操作中也启用这些指令,你需要重新编译TensorFlow,并使用相应的编译器标志来启用AVX和AVX2指令集。
AVX(Advanced Vector Extensions-Intel® AVX) 是intel 优化CPU用于浮点计算的技术,如果有GPU了,其实不用考虑该警告讯息。 不过, 不管怎么说, 如果不愿意看到该警告讯息, 可以加上如下2行代码:
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
该代码是用来设置TensorFlow的日志级别的。通过设置os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
,将日志级别设置为最低级别,即只显示错误信息,不显示其他日志信息。这可以帮助减少不必要的日志输出,使程序的运行输出更加简洁。
Previous PyTorch Versions | PyTorch
https://pytorch.org/get-started/previous-versions/
pip install torch==1.8.1+cu101 torchvision==0.9.1+cu101 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html
conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.1 -c pytorch
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia