在WSL中使用RAPIDS时，为什么会出现CUDA内存错误？

文章/答案/技术大牛

发布

1回答

、、、、

我在Windows21H2 (19044.1348)下安装了WSL2 (5.10.60.1-microsoft-standard-WSL2)，使用的是带有pascal GPU (1070)的NVidia我在WSL中使用默认的ubuntu版本(20.04.3LTS)，我尝试了docker和anaconda版本。我可以运行Jupiter Notebook并导入该库。但是写入它或执行其他任何操作都会产生内存错误。__cinit__() M

浏览 130提问于2021-11-20得票数 0

回答已采纳

1回答

Dask-快速数据移动和内存不足问题

、、、

我在我的项目中使用了dask (2021.3.0)和rapids(0.18)。在这个过程中，我在CPU上执行预处理任务，然后将预处理后的数据传输到GPU进行K均值聚类。但在这个过程中，我遇到了以下问题： 1个工作任务中的1个失败: std::bad_alloc: CUDA错误: GPU内存不足(在完全使用~/envs/include/rmm/

浏览 9提问于2021-03-19得票数 0

1回答

设备内存分配在WSL2上失败

、、、

我试图在c++上运行一个简单的WSL2程序，其中包含了Cuda的推力函数。程序似乎在运行时分配设备内存失败。我一直在使用的推力，并且没有任何错误。CMakeLists.txt：project(proj LANGUAGES CXX CUDA)add_executableget_max_shared_memory_per_block :failed to

浏览 8提问于2021-07-05得票数 0

回答已采纳

2回答

对于2D malloc数组，不释放内存？

、、、、

我正在起草一份来自WSL1的代码，我正在抓挠我的后脑勺，因为我有一个非常令人困惑的问题。 megaarray[i]=(int*)malloc(y*sizeof(int) ); // y = 4200, integer分配进行得很好，我使用这段RAM，然后在一些计算结束时，我尝试取消分配： for(int i=0; i<x * count; i++){

浏览 6提问于2022-06-03得票数 0

5回答

nvidia-smi未能初始化被操作系统阻止的NVML: GPU访问。

、、

浏览 17提问于2015-11-20得票数 21

回答已采纳

1回答

无法得到cuda 12工作的ubuntu WSL2 (火把)

、

几天来，我一直在尝试让cuda在WSL2上工作，尝试将cuda 12从控制台上卸载。/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.0-1_all.debsudoDefault | |

浏览 0提问于2023-01-12得票数 1

回答已采纳

1回答

Python用于训练机器学习模型时的记忆错误

、、、、

我正在使用python 3与nvidia急流，以加快机器学习培训使用孜然库和GPU。这是我用来训练孜然模型的代码。cumllr = LinearRegression() l

浏览 0提问于2019-06-06得票数 1

1回答

运行pyspark时获取Java输出

、、、

当我在Ubuntu上的Jupyter Notebook中运行PySpark时，我有时会遇到Java失败的问题。我为什么需要这些日志的例子是，例如，我试图在DGX-1机器上的PySpark上运行Rapids，但它在初始化Spark Context时以类似abo的Java崩溃而结束。这不是导致这些错误的唯一原因，但这段代码很容易在我这边导致这些错误。import pysparkcudf = &quo

浏览 7提问于2021-02-02得票数 0

2回答

cuda-gdb是否自动为CUDA_EXCEPTION_5扭曲超出范围的地址错误选择正确的焦点？

、、

我有一个CUDA_EXCEPTION_5内核出问题了，Warp of-range Address。 cuda-gdb自动将焦点放在特定的块上。是发生错误的块，还是当nvidia文档显示CUDA_EXCEPTION_5“不精确”时，这意味着调试器无法确定在哪个块/线程中发生了特定的异常？如果只是粒度到偏差，是否有办法在cuda-gdb中找出异常发生在哪个偏差中，以及哪些块属于该偏差？

浏览 2提问于2012-12-04得票数 2

回答已采纳

、、

问题：在运行CentOS 7的Nvidia GPU上运行PyTorch脚本时，我偶尔会遇到以下CUDA错误。如果我运行： python3 -c 'import torch; print(torch.cuda.is_available()); torch.randn(1).to("cuda")' 我得到以下输出error: all CUDA-capable devices are busy or unavailable <em

浏览 534提问于2021-11-10得票数 1

1回答

Alea GPU内存分配限制

、

我使用的是带有GTX-1081ti的Alea，它有11 of的全局内存。当我使用Alea Gpu.Default.Allocate方法在GPU上分配内存时，当我站到3+ GB附近时，就会出现一个“内存不足”错误。Length = 2147000000;var gpu = Gpu.Default; 这应该分配大约8GB的GPU，但它提供

浏览 3提问于2018-09-30得票数 1

回答已采纳

2回答

CUDA/PyCUDA:诊断在cuda-gdb下消失的启动故障

、、、、

有谁知道在cuda-gdb下运行时会消失的内核启动失败的可能调查途径？内存分配在规范范围内，每次在同一内核的相同运行中启动都会失败，而且(到目前为止)在调试器中还没有失败。

浏览 1提问于2011-04-21得票数 0

回答已采纳

1回答

如何释放Numba cuda占用的GPU内存？

、、

x_cpu，y_cpu，z_cpu是等长的大数组，结果是网格结果，会降低x，y，z分辨率，每个网格只保留一个点，它们不能一起放到内存中。所以我将x，y，z分成几个部分，但仍然将整个结果放入使用的GPU内存中from math import ceil x = cuda.to_device(x_cpu[lopIdx*Segment

浏览 70提问于2020-07-30得票数 1

2回答

在cudaMemcpyFromSymbol中使用指针声明全局设备数组

当我使用下面的代码时，它显示了正确的值3345。<< h_Array[0] << std::endl;但是如果我们用__device__ int *d_Array;替换__device__ int d_Array[1];这行代码，它会显示一个错误的值为什么？

浏览 95提问于2016-04-13得票数 2

3回答

CUDA错误消息:未指明的启动失败

、

这是我的CUDA代码的一部分。但是这段代码的最后一部分显示了一些错误消息。=cudaSuccess)printf("\n3 %s\n", cudaGetErrorString(err));以下部分代码报告了此错误消息"unspecified launch failure我不知道为什么会报告此错误消息。

浏览 6提问于2012-03-28得票数 17

点击加载更多