首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >CUDA内核__global__内的断点未命中

CUDA内核__global__内的断点未命中
EN

Stack Overflow用户
提问于 2012-02-10 05:25:11
回答 2查看 1.2K关注 0票数 0

使用视觉工作室2010。胜利7. Nsight 2.1

代码语言:javascript
运行
AI代码解释
复制
#include "cuda.h"
#include "cuda_runtime.h"
#include "device_launch_parameters.h"

// incrementArray.cu
#include <stdio.h>
#include <assert.h>

void incrementArrayOnHost(float *a, int N)
{
  int i;
  for (i=0; i < N; i++) a[i] = a[i]+1.f;
}
__global__ void incrementArrayOnDevice(float *a, int N)
{
  int idx = blockIdx.x*blockDim.x + threadIdx.x;

  int j = idx;
  int i = 2;

  i = i+j; //->breakpoint here

  if (idx<N) a[idx] = a[idx]+1.f; //->breakpoint here
}
int main(void)
{
  float *a_h, *b_h;           // pointers to host memory
  float *a_d;                 // pointer to device memory
  int i, N = 10;
  size_t size = N*sizeof(float);
  // allocate arrays on host
  a_h = (float *)malloc(size);
  b_h = (float *)malloc(size);
  // allocate array on device 
  cudaMalloc((void **) &a_d, size);
  // initialization of host data
  for (i=0; i<N; i++) a_h[i] = (float)i;
  // copy data from host to device
  cudaMemcpy(a_d, a_h, sizeof(float)*N, cudaMemcpyHostToDevice);
  // do calculation on host
  incrementArrayOnHost(a_h, N);
  // do calculation on device:
  // Part 1 of 2. Compute execution configuration
  int blockSize = 4;
  int nBlocks = N/blockSize + (N%blockSize == 0?0:1);
  // Part 2 of 2. Call incrementArrayOnDevice kernel 
  incrementArrayOnDevice <<< nBlocks, blockSize >>> (a_d, N);
  // Retrieve result from device and store in b_h
  cudaMemcpy(b_h, a_d, sizeof(float)*N, cudaMemcpyDeviceToHost);
  // check results
  for (i=0; i<N; i++) assert(a_h[i] == b_h[i]);
  // cleanup
  free(a_h); free(b_h); cudaFree(a_d);

  return 0;
}

我尝试在我的全局 void incrementArrayOnDevice(float *a,int )中插入上面列出的断点,但它们没有命中。

当我在可视化工作室中运行调试(f5)时,我尝试进入incrementArrayOnDevice <<< nBlocks,blockSize >>> (a_d,N);但是它们将跳过整个内核代码部分。

试图在变量i和j上添加一个手表,但是出现了一个错误"CXX0017: Error:符号“"i”没有找到。

这个问题正常吗?请有人在他们的电脑上试试看,让我知道他们是否能击中断点?如果你可以,我的问题可能是什么?请帮帮忙!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-02-11 22:09:34

Nsight调试与VS调试不同。您需要使用Nsight调试来命中内核断点。然而,为此,您需要2个GPU卡。你一开始有两张牌吗?请查收

票数 1
EN

Stack Overflow用户

发布于 2013-02-16 11:53:37

您可以在单个GPU上调试,但可以在以下条件下进行调试:

  1. 您必须使用5.0工具包
  2. 您必须在支持303.xx NForceWare或更高的

的GPU上编程

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9228473

复制
相关文章
\[vscode issue\] Golang Debug 无法命中断点
Kevinello
2023/10/18
5991
\[vscode issue\] Golang Debug 无法命中断点
MySQL的order by该如何避免“未命中索引“
  要学会如何使用,你先要搞清楚:1、怎么看SQL是否用上了索引;2、怎么写SQL能避开出错点。
陈哈哈
2022/05/31
2.6K0
MySQL的order by该如何避免“未命中索引“
GPU编程(四): 并行规约优化
如果之前没有用过gdb, 可以速学一下, 就几个指令. 想要用cuda-gdb对程序进行调试, 首先你要确保你的gpu没有在运行操作系统界面, 比方说, 我用的是ubuntu, 我就需 要用sudo service lightdm stop关闭图形界面, 进入tty1这种字符界面. 当然用ssh远程访问也是可以的. 接下来, 使用第二篇中矩阵加法的例子. 但是注意, 编译的使用需要改变一下, 加入-g -G参数, 其实和gdb是相似的.
sean_yang
2019/03/04
1.6K1
GPU编程(四): 并行规约优化
CUDA编程.内核调用
首先我说一下什么叫内核,这里的内核很狭义就是ANSI C关键字+CUDA扩展关键字编写的设备代码~
云深无际
2021/03/12
9400
CUDA编程.内核调用
Unity3D 判断点击命中物体对象和命中环境
一个大的空对象包含很多小的物体,在大的空对象上面添加一个脚本,这个脚本核心就是通过 Update 方法里面拿到鼠标点击,判断当前是不是点击这个对象
林德熙
2022/08/12
4160
linux内核断点调试入门
上篇文章 编译一个默认输出hello world的linux内核 中,我们已经知道如何编译一个可以自运行的linux内核,这篇文章我们来看下如何对内核进行断点调试。
KINGYT
2020/04/13
3.5K0
GIS算法—判断点在面内
牛老师讲GIS
2023/05/27
7610
GIS算法—判断点在面内
CUDA编程之线程模型
一个kernel结构如下:Kernel<<>>(param1, param2, …)
AI异构
2020/07/29
2.7K0
CUDA编程之线程模型
CUDA编程.配置内核参数+API函数
为了我们获得并行能力,需要做一些配置CIA可以,这个配置在内核启动中写。它们指定了Grid中块的数量,和每一个块中线程的数量。每个快上面有512或者1024个线程。
云深无际
2021/03/12
7320
CUDA编程.配置内核参数+API函数
CUDA 02 - 逻辑模型
CUDA逻辑模型是异构模型, 需要CPU和GPU协同工作. 在CUDA中, host和device是两个重要概念, host是指CPU及其内存, device是指GPU及其内存. 典型的CUDA程序的执行流程如下:
Reck Zhang
2021/08/11
5200
CUDA 02 - 逻辑模型
腾讯云CDN+日志服务统计URL未命中top10
文章参考自官方文档,但无奈官方文档写的demo未联合说明怎么改,顺便mark下来做记录
105号运维实习生
2020/11/13
1.5K2
腾讯云CDN+日志服务统计URL未命中top10
使用显卡程序加速(opencl、cuda)
CPU使用冯诺依曼结构,缓存大,处理单元少 GPU处理图像每个像素可以单独处理,缓存小,处理单元很多
sofu456
2020/12/08
1.4K0
AI部署篇 | CUDA学习笔记1:向量相加与GPU优化(附CUDA C代码)
GPU并不是一个独立运行的计算平台,而需要与CPU协同工作,也可以把GPU看成是CPU的协处理器,因此当在说GPU并行计算时,其实是指的基于CPU+GPU的异构计算架构。在异构计算架构中,GPU与CPU通过PCIe总线连接在一起进行协同工作,CPU所在位置称为为主机端(host),而GPU所在位置称为设备端(device),如下图所示。
集智书童公众号
2022/01/05
2.8K0
AI部署篇 | CUDA学习笔记1:向量相加与GPU优化(附CUDA C代码)
新手,想用Nisight调试CUDA代码,但断点无效怎么破?
新手,刚接触CUDA编程,搭好了环境,想用nsight来调试,在vs里面,在核函数里面设置了断点,用CUDA Debugging,但断点就是不生效,电脑左下角会弹出Night 连接成功,程序跑完后,Night会提示Disconnected 整个电脑环境: 显卡: GF GTX1050 CPU: i3-4170 3.70GH 硬盘: 2T 软件:VS2013 + CUDA9.1 + Nsight 5.4 GPU世界论坛 bbs.gpuworld.cn Hi, 楼主, 这个
GPUS Lady
2018/04/24
3.1K0
《GPU高性能编程 CUDA实战》(CUDA By Example)读书笔记
写在最前 这本书是2011年出版的,按照计算机的发展速度来说已经算是上古书籍了,不过由于其简单易懂,仍旧被推荐为入门神书。先上封面: 由于书比较老,而且由于学习的目的不同,这里只介绍了基础
用户1148523
2018/01/09
2.8K0
《GPU高性能编程 CUDA实战》(CUDA By Example)读书笔记
CUDA-GDB安装+环境配置
在GPU上开发大规模并行应用程序时,需要一个调试器,GDB调试器能够处理系统中每个GPU上同时运行的数千个线程。CUDA-GDB提供了无缝的调试体验,可以同时调试应用程序的CPU和GPU部分。
云深无际
2021/03/12
2.6K0
CUDA-GDB安装+环境配置
CUDA编程.打印
首先是注意,所有的cuda代码都是cu的后缀 #include<iostream> #include<cuda_runtime.h> __global__ void myfirstkernel(voi
云深无际
2021/03/12
7350
CUDA编程.打印
判断点在多边形内算法的C++实现
判断平面内点是否在多边形内有多种算法,其中射线法是其中比较好理解的一种,而且能够支持凹多边形的情况。该算法的思路很简单,就是从目标点出发引一条射线,看这条射线和多边形所有边的交点数目。如果有奇数个交点,则说明在内部,如果有偶数个交点,则说明在外部。如下图所示:
charlee44
2019/08/13
6.1K0
DAY36:阅读”执行空间&扩展修饰符
B. C Language Extensions B.1. Function Execution Space Specifiers Function execution space specifiers denote whether a function executes on the host or on the device and whether it is callable from the host or from the device. B.1.1. __device__ The __dev
GPUS Lady
2018/06/25
5360
Udacity并行计算课程笔记-The GPU Programming Model
一、传统的提高计算速度的方法 faster clocks (设置更快的时钟) more work over per clock cycle(每个时钟周期做更多的工作) more processors(更多处理器) 二、CPU & GPU CPU更加侧重执行时间,做到延时小 GPU则侧重吞吐量,能够执行大量的计算 更形象的理解就是假如我们载一群人去北京,CPU就像那种敞篷跑车一样速度贼快,但是一次只能坐两个人,而GPU就像是大巴车一样,虽然可能速度不如跑车,但是一次能载超多人。 总结起来相比于CPU,GPU有
marsggbo
2018/01/23
1.2K0
Udacity并行计算课程笔记-The GPU Programming Model

相似问题

CUDA __global__函数未调用

13

断点未命中

40

Firebug -断点未命中

1123

未命中javascript断点

59

MonoDevelop -断点未命中

13
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文