我注意到,为了使用推力,必须始终将数据从cpu内存复制到gpu内存。让我们看下面的例子:{ device_vector<int> s =m;我不太确定host_vector构造函数是如何工作的,但似乎我正在复制来自*foo的初始数据两次-一次是在host_vector初始化时,另一次是在device_vector初始化时。有没有更好的方法<em
我尝试填充一个充满指向我的字符串的指针的device_vector,然后对我的MemCmp谓词运行它。首先,device_vector是否“知道”将字符串从主内存复制到GPU内存,还是只复制了一个指针值?我是不是应该使用results::copy将内存复制到一个host_vector中,这样一个类似于末尾的循环是否足以查看结果?
// I initialize a device_vector and