使用视觉工作室2010。胜利7. Nsight 2.1
#include "cuda.h"
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
// incrementArray.cu
#include <stdio.h>
#include <assert.h>
void incrementArrayOnHost(float *a, int N)
{
int i;
for (i=0; i < N; i++) a[i] = a[i]+1.f;
}
__global__ void incrementArrayOnDevice(float *a, int N)
{
int idx = blockIdx.x*blockDim.x + threadIdx.x;
int j = idx;
int i = 2;
i = i+j; //->breakpoint here
if (idx<N) a[idx] = a[idx]+1.f; //->breakpoint here
}
int main(void)
{
float *a_h, *b_h; // pointers to host memory
float *a_d; // pointer to device memory
int i, N = 10;
size_t size = N*sizeof(float);
// allocate arrays on host
a_h = (float *)malloc(size);
b_h = (float *)malloc(size);
// allocate array on device
cudaMalloc((void **) &a_d, size);
// initialization of host data
for (i=0; i<N; i++) a_h[i] = (float)i;
// copy data from host to device
cudaMemcpy(a_d, a_h, sizeof(float)*N, cudaMemcpyHostToDevice);
// do calculation on host
incrementArrayOnHost(a_h, N);
// do calculation on device:
// Part 1 of 2. Compute execution configuration
int blockSize = 4;
int nBlocks = N/blockSize + (N%blockSize == 0?0:1);
// Part 2 of 2. Call incrementArrayOnDevice kernel
incrementArrayOnDevice <<< nBlocks, blockSize >>> (a_d, N);
// Retrieve result from device and store in b_h
cudaMemcpy(b_h, a_d, sizeof(float)*N, cudaMemcpyDeviceToHost);
// check results
for (i=0; i<N; i++) assert(a_h[i] == b_h[i]);
// cleanup
free(a_h); free(b_h); cudaFree(a_d);
return 0;
}
我尝试在我的全局 void incrementArrayOnDevice(float *a,int )中插入上面列出的断点,但它们没有命中。
当我在可视化工作室中运行调试(f5)时,我尝试进入incrementArrayOnDevice <<< nBlocks,blockSize >>> (a_d,N);但是它们将跳过整个内核代码部分。
试图在变量i和j上添加一个手表,但是出现了一个错误"CXX0017: Error:符号“"i”没有找到。
这个问题正常吗?请有人在他们的电脑上试试看,让我知道他们是否能击中断点?如果你可以,我的问题可能是什么?请帮帮忙!
发布于 2012-02-11 22:09:34
Nsight调试与VS调试不同。您需要使用Nsight调试来命中内核断点。然而,为此,您需要2个GPU卡。你一开始有两张牌吗?请查收
发布于 2013-02-16 11:53:37
您可以在单个GPU上调试,但可以在以下条件下进行调试:
的GPU上编程
https://stackoverflow.com/questions/9228473
复制相似问题