当我尝试使用2D数组运行以下代码时,不断收到PyCUDA警告,指出清理操作由于地址未对齐而失败。import pycuda.autoinitimport numpy as nppycuda._driver.LogicError: cuCtxSynchronize failed: misaligned address
P
我正在研究入侵物种的传播,并试图使用XORWOW随机数生成器在PyCUDA内核中生成随机数。我需要在研究中使用的矩阵是相当大的(高达8,000 x 8,000)。grid_dims), block = (block_dims, block_dims, 1))
我希望能够为(8,000 x 8,000)的矩阵在(0,1)范围内生成随机数,但是在大型矩阵上执行我的代码会导致非法的内存访问错误pycuda._driver.LogicError: cuMemcpyDtoH failed: an