get_global_id是否包含偏移量？

文章/答案/技术大牛

发布

1回答

、

如果我通过调用带有全局工作项偏移量的clEnqueueNDRangeKernel来运行内核，get_global_id是返回偏移值还是应该手动偏移值？.); 正确的方式应该是：int id = get_global_id(0)或int id = get_global_id(0) + get_global_offset(0);

浏览 128提问于2021-07-16得票数 0

回答已采纳

1回答

OpenCL全局工作大小和偏移量问题

假设全球工作大小为32，我将偏移量设置为1，这是否意味着get_global_id(0)将从1开始到31结束，使有效的全局工作大小变为31而不是32？如果我想将总体工作大小保留为32，那么当我将偏移量设置为1时，是否应该将全局工作大小指定为32+1？

浏览 1提问于2022-06-26得票数 0

回答已采纳

1回答

opencl在内核中迭代数组

、、

我有两个数组，一个是每个内核调用的固定大小，另一个是映射到一维数组的常规3D网格。让我们称这个数组为meshData第二个数组保存x，y，z坐标和那些没有与meshData数组对齐的点的值。让我们称其为pointData。for (l = 0; l < points; l++) { if(x1Cell <=pointdata

浏览 0提问于2013-06-22得票数 0

1回答

如何在内核中定义/使用函数

、

kernelCode = "{" "}"; sources.push_back({kernelCode.c_str(), kernelCode.length()})

浏览 3提问于2014-02-10得票数 0

回答已采纳

2回答

CPU运行速度比GPU快(OpenCL代码)

、、、、

我用OpenCL写了一段代码来寻找前5000个质数。下面是代码：{ A[1]=3; int pnp;//pnp=probable next prime int i,j; { pprime=A[i-1]; wh

浏览 0提问于2015-07-06得票数 1

1回答

如果我们只有全局大小和本地id，就能得到全局id？

、、

如果工作组(2,3)中内核的特定执行具有get_global_id(0)和get_global_id(1)是什么它是否等于 get_global_id(1) = 3*7 = 21

浏览 2提问于2014-04-09得票数 0

回答已采纳

1回答

command_queue, kernel, 2, NULL, globalWorkSizeCalc, localWorkSizeCalc, 0, NULL, NULL); 在内核内部，如何计算一个简单的数组加法的索引偏移量//use vectors for conciseness int2 globalId = (int2)(get_global_id(0), get_global_id(1)); // 0..31 xindex]; 在localworksize为32X32的情况下运行相同的代码，

浏览 26提问于2021-04-05得票数 0

回答已采纳

1回答

在OpenCL中，CUDA如何处理线程偏移量？

、、

例如，我可以在OpenCL中的线程I上启动带有偏移量的内核，因此当使用多个GPU时，第二个GPU线程可以直接从任意整数值开始：GPU2: threadidx k+1 to N__kernel(..) int threadId=get_global_id(0); // this starts fromlocal_work_size, const cl_ev

浏览 0提问于2018-01-28得票数 1

回答已采纳

1回答

如何从N个固定长度字符串的缓冲区中处理opencl内核中的字符串？

、

我需要在OpenCL设备上并行处理N个固定长度的字符串.void Function(const char *input_buffer, const int string_length, const char *output_buffer)我想创建一个内核，其定义类似于 __kernel void myKernel(global char *buffer_of_strings, char length_of_

浏览 1提问于2019-03-11得票数 0

回答已采纳

1回答

CUDA to OpenCL :在OpenCL中，什么等同于(块Idx.x+块Idx.ygridDim.x)块Dim.x+线程Idx.x？

、

CUDA函数中，他们使用下面的代码片段获取操作索引，get_global_id(0)是否等同于OpenCL中的上述内容？int id = get_global_id(0);

浏览 3提问于2017-07-20得票数 3

回答已采纳

1回答

一种在OpenCl内核中偏移索引的方法？

、

int *C, int Offset, int constant) { int i = get_global_idconstant] = A[i + Offset*constant] + B[i + Offset*constant];虽然constant是一个常量，但我希望Offset是一个排序的“数组”，包含值const int *Offset, int constant) { // In

浏览 0提问于2017-02-23得票数 0

1回答

NDRange工作项数

、

void kernel copy(global const int* image, global int* result)" "result[get_global_id(0)] = image[get_global_id(0)];"图像包含200 * 300像素。

浏览 2提问于2014-02-06得票数 0

回答已采纳

1回答

Tesseract OCR word-dawg不包含在combine_tessdata中

、

但是，无论我是否包含单词-dawg和单词列表，combine_tessdata结果都是相同的。所以我不确定我的word-dawg和wordlist是否包含在我的训练数据中。输出如下:类型0偏移量是-1类型1的偏移量是140类型2的偏移量是3726类型3的偏移量是3904类型4的偏移量是346848类型5的偏移量是347329类型6的偏移量是347329类型7的偏移量是-1类型8的<

浏览 0提问于2016-02-26得票数 0

1回答

OpenCL内核总和

、、

我想知道这是不是可以做到...我想在java的内核内部检查数组中是否包含数字和字符，如果包含，保存它们在输出数组中出现的次数。global const char *a, __global int *c){" + " int gid = get_global_id

浏览 4提问于2013-05-08得票数 1

1回答

用openCL /C实现矩阵乘法

、、、

2)我不理解a_mat和b_mat的地址偏移量，即a_mat += start；b_mat += start*4； int num_rows = get_global_size(0); int start = get_global_id

浏览 3提问于2012-11-04得票数 0

回答已采纳

3回答

OpenCL -为什么使用READ_ONLY或WRITE_ONLY缓冲区

、、、、

在OpenCL中，将缓冲区标记为READ_ONLY或WRITE_ONLY是否对性能有任何好处？，b是WRITE_ONLY)：{__kernel void one_buffer_double(__global float* a) int i = get_global_id

浏览 8提问于2013-07-27得票数 8

回答已采纳

2回答

从内核函数数组元素调用函数的OpenCL为0

、、、

它包含两个函数，其中__kernel函数调用另一个(非内核)函数。我想把数组传递给这个函数，但是当我这样做的时候，我的函数(add)总是返回0。完整的数组是0。[2]; result[get_global_id(0)] = numArray[0] // result[get_global_id(0)] = add(numArray)

浏览 1提问于2013-11-12得票数 0

1回答

OpenCL max_work_item_sizes

、、、、

我可以通过以下方法来模拟np.arange函数：__kernel void arange(__global int *res_g) int gid = get_global_id与此相关的另一个问题是，使用尽可能多的工作维度是否有益？据我所知，最多可以使用三维。np.arange的方法可以通过以下方法完成：__kernel void arange(__global int *res_g

浏览 1提问于2021-04-20得票数 0

回答已采纳

2回答

如何将像素坐标表示为一维数组？

queue.enqueueReadBuffer(d_op, CL_TRUE, 0, W*H*sizeof(float), img); const int x = get_global_id(0);如果所有新的像素坐标都是在内核中计算出来的，那么不能只传递一个大小适当的空浮点数组(显然是W_H，但我不知道它怎么不是W_H*2

浏览 4提问于2013-07-24得票数 0

回答已采纳

1回答

是否可以在pyopencl中运行4维工作项？

、

所以我的问题是，是否可以在pyopencl中更改此设置。从其他地方的这个other answer中，我了解到pyopencl会立即输入尺寸，但考虑到我的错误，我认为肯定存在一些问题。cl.CommandQueue(context) __kernel void fun3d( __global double *output) size_t i = get_global_id(0); si

浏览 16提问于2021-07-07得票数 0

回答已采纳

点击加载更多