我想知道如何解释以下OpenMP结构:for(int i = 0; i < N; ++i) {根据SIMD5.1规范,这个子句声明:“可以通过使用OpenMP指令并发执行循环的多个迭代”。我相信我能很好地理解simd是如何实现的,在CPU上如何工作,但是在GPU上,更确切地说,在AMD上,没有暴露的SIMD指令,也就是说,HIP线程实际上是一个SIMD指令通道。根据
我读到clang编译器可以将OpenMP区域卸载到GPU。但是,我对如何用clang编译代码感到困惑。我想卸载的代码基本上是矩阵-矩阵乘法: for (i=0; i<N; i+argument unused during compilation: '-fopenmp-targets=x86_64-unknown-linux-gnu'
我不知道的是,我安装的clang版本是否能够将代码卸<e