腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
相当于
OpenCL
中
的
cudaSetDevice
?
、
我在另一台机器上有一个cuda版本,我只是运行 checkCudaErrors(
cudaSetDevice
((unsigned int)device_id)); 来获得我想要
的
行为。对于
openCL
,我尝试做了以下几件事: void createDevice(int device_idx) cl_device_id *devices; ret = clGetPlatformIDscontext = clCreateContext( NULL, 1, &device_id, NULL, NULL, &ret
浏览 24
提问于2021-02-22
得票数 1
回答已采纳
2
回答
编译
OpenCL
HelloWorld程序:链接器错误
、
、
、
、
我
的
参考代码摘自Aaftab Munshi
的
"
OpenCL
编程指南“。代码
的
源文件可以在上找到。mkdir buildcmake ../ "CodeBlocks - Unix Makefiles"这似乎是构建过程
的
问题,而
浏览 0
提问于2019-01-26
得票数 1
回答已采纳
1
回答
对CPU设备使用
OpenCL
时调用外部函数
、
我正在评估使用
OpenCL
对CPU设备
的
性能临界数学表达式进行实时编译
的
可能性。我目前正在直接使用LLVM (或者更确切地说,我有一个概念
的
工作证明),但是我会发现
OpenCL
提供
的
抽象在未来非常有用。我现在试图找出在对CPU设备使用
OpenCL
时是否有某种方式调用具有外部链接
的
函数,这
相当于
LLVM
中
的
以下内容: ... = llvm::Function::Create(..., llvm::Fu
浏览 1
提问于2013-01-19
得票数 1
回答已采纳
1
回答
CUDA块-全并行基元
、
是否有任何内置
的
CUDA内核函数
相当于
OpenCL
2.0 work_group_*函数?我对这些操作
的
天真实现不如
OpenCL
的
内置函数执行得好,我希望使用__shfl
的
实现可以用CUDA来加快速度。
浏览 0
提问于2018-04-04
得票数 0
回答已采纳
1
回答
OpenCL
中
的
HyperQ支持
、
、
我想运行在单个GPU上异步执行
的
异构内核。我认为在Nvidia Kepler K20(或任何具有计算能力
的
3.5+设备)
中
,这是可能
的
,方法是将每个内核启动到不同
的
流,运行时系统根据资源可用性将它们映射到不同
的
硬件队列。在
OpenCL
中
可以访问此功能吗?如果是这样的话,
OpenCL
中
的
CUDA“流”
相当于
什么?Nvidia驱动程序是否支持通过
OpenCL
在其K20
浏览 1
提问于2013-05-13
得票数 2
1
回答
atom_add函数在具有较老计算能力
的
openCL
非整数上
的
实现
、
我想用非整数数字(浮点数和双号)在设备内存中使用原子函数,例如,我在CUDA C编程指南中看到了实现双精度浮点数atomicAdd函数
的
下一个代码:}在
openCL
中
可以做类似的事情吗?我有一个具有计算能力2.1
的
设备double atom_add_dou
浏览 1
提问于2019-06-11
得票数 1
回答已采纳
2
回答
将
OpenCL
函数更改为C++
、
我正在尝试用C++编写代码,但是在互联网上搜索了一些代码之后,我发现一个基于
OpenCL
的
代码正在做与我想在C++
中
做
的
事情完全一样
的
事情。但是,由于这是我第一次看到
OpenCL
代码,我不知道如何将以下函数转换为c++:inty = get_global_id(1); “const __glo
浏览 6
提问于2014-02-19
得票数 1
回答已采纳
1
回答
关于Open MP和
cudaSetDevice
()
、
、
、
、
有没有人知道下面
cudaSetDevice
的
用法是否正确?我想在任何时间在任何主机线程
中
重复调用在不同设备上创建
的
资源;在CUDA中有没有办法做到这一点?
cudaSetDevice
(0);
cudaSetDevice
(1)if (omp_threadID==0)
cudaSetDevice
(0);
浏览 0
提问于2013-07-12
得票数 3
回答已采纳
1
回答
当使用cudaMallocHost分配内存时,cudaFreeHost是否关心哪个设备处于活动状态?
错误值为cudaErrorInvalidValueerr =
cudaSetDevice
( 0 ); err = cudaMallocHost(&test, 1024*sizeof(int)); 以下变体不会抛出错误:和 err =
cudaSetDevice
( 1 ); err
浏览 0
提问于2011-12-21
得票数 8
回答已采纳
1
回答
截至2018年年
中
,NVIDIA SPIR支持
的
状况如何?
、
、
、
从那时起,NVIDIA对Khronos
OpenCL
的
支持在这段时间里得到了改善,而且它还采用了Khronos (我对此知之甚少),我想知道事情是否改变了w.r.t。如果你愿意的话,SPIR (
相当于
PTX
的
Khronos标准)也一样。
浏览 0
提问于2018-07-23
得票数 2
回答已采纳
1
回答
我应该使用哪个设备号(0或1)复制P2P (GPU0->GPU1)?
、
、
要使用
cudaSetDevice
();复制P2P (GPU0 0->GPU0 1),必须设置多少设备在cudaStreamCreate(stream); cudaMemcpyPeerAsync(p1,1, p0, 0, size, stream);
中
设置0或1?
cudaSetDevice
(1); //
cudaSetDevice
(0); cudaStreamCreate(stream); MyK
浏览 2
提问于2014-03-29
得票数 1
回答已采纳
1
回答
有多少线程(或工作项)可以同时运行?
、
我是新
的
GPGPU编程,我正在与NVIDIA实现
的
OpenCL
。如何在我的卡片上获得工作组
的
数量(并且可以同时运行)和在一个工作组上
的
工作项
的
数量?与CL_DEVICE_MAX_COMPUTE_UNITS对应
的
是什么? khr
浏览 5
提问于2011-04-15
得票数 19
1
回答
CUDA:无效设备序号
我想让我
的
用户选择运行哪个GPU。所以我在我
的
机器上测试,它只有一个GPU (设备0),如果他们选择一个不存在
的
设备会发生什么。非常
浏览 2
提问于2014-03-04
得票数 10
回答已采纳
1
回答
替代GPGPU
的
着色器
、
、
我可以在5个选项中选择:
OpenCL
,CUDA,FireStream,Close to Metal,DirectCompute。嗯,不是真的在为我
的
需求过滤后没有西装:)我正在使用Radeon 3870HD,所以CUDA出来了,我想跨平台
的
DirectCompute出来,接近金属演变到FireStream (
相当于
openCL
的
CUDA ),FS现在为了
openCL
的
利益而被“弃用”。
openCL
可从radeon 4xxx系列获得。
浏览 0
提问于2011-01-30
得票数 10
回答已采纳
1
回答
将MPI限制为在单个GPU上运行,即使我们设置了单节点多GPU
、
、
、
、
我是分布式计算
的
新手,我正在尝试运行一个使用MPI和ROCm(图形处理器上运行
的
AMD框架)
的
程序。 我用来运行程序
的
命令是mpirun -np 4 ./a.out 但它默认运行在我机器上可用
的
2个GPU上。有没有办法让它只在单个GPU上运行,如果是,如何运行? 提前感谢:)
浏览 226
提问于2020-03-20
得票数 1
回答已采纳
1
回答
如何使用钩子劫持
cudaSetDevice
和修改设备id?
、
、
、
我想用钩子(LD_PRELOAD)劫持
cudaSetDevice
并修改设备id。劫持成功后,gpu任务提交错误。 我试图劫持driver api
中
的
cuCtxCreate函数,但我无法劫持它。同样
的
方法可以劫持cuDevicePrimaryCtxRetain函数,该函数可以被劫持,并且在修改设备id时会出现错误。runtime api // define dynamic library same name functi
浏览 175
提问于2019-04-10
得票数 0
1
回答
运行时API应用程序
中
的
cuda上下文创建和资源关联
、
我想了解cuda上下文是如何在cuda运行时API应用程序
中
创建并与内核相关联
的
? 我知道它是通过驱动程序API在引擎盖下完成
的
。但我想了解造物
的
时间线。如何获得这个已经创建
的
上下文
的
句柄,并将未来
的
运行时API调用与其关联?请揭开内部工作
的
神秘。如果CUDA运行时创建了一个CUcontext,那么CUcontext将使用CUDA运行时API函数
cudaSetDevice
、cudaSetValidDevices、cudaSetDevi
浏览 4
提问于2011-09-23
得票数 6
回答已采纳
1
回答
Vulkan子组可访问
的
本地内存
的
查询大小
、
、
、
例如,在
OpenCL
中
,我可以调用 cl_ulong size; clGetDeviceInfo(deviceID, CL_DEVICE_LOCAL_MEM_SIZE, sizeof(cl_ulong)
浏览 24
提问于2021-08-01
得票数 0
回答已采纳
1
回答
在native_recip()
中
是否存在与
OpenCL
()相当
的
数据自动化系统?
、
、
OpenCL
有一个名为
的
内置函数。 native_recip在实现定义
的
范围内计算倒数。最大
的
错误是实现定义
的
。数学函数
的
矢量版本按组件
的
方式操作。描述是每个组件。 内置
的
数学函数不受调用环境
中
普遍存在
的
舍入模式
的
影响,并且始终返回与调用最接近甚至舍入模式时相同
的
值。在数据自动化系统
中
是否有
相当于<
浏览 1
提问于2020-07-26
得票数 2
回答已采纳
1
回答
使用独立流在多个GPU上同时调用相同
的
cuda函数
我正在多个GPU上实现我
的
程序...我
的
PC中有两个GPU,我希望生成两个独立
的
流来处理这两个设备。根据设备id,设置cudaDevice (
cudaSetDevice
(dev_ID);),并通过相应
的
流传递内核调用: deini(i); printf("deini
浏览 1
提问于2012-07-17
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Oracle数据库中的空值相当于
OpenCL编程指南
苹果弃用 OpenCL 和 OpenGL ,OpenCL 或遭全面淘汰
苹果弃用 OpenCL 和 OpenGL ,OpenCL 或遭全面淘汰
OpenCL-1-编程四大模型介绍
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券