据我所知,#pragma omp parallel及其变体基本上在多个并发线程中执行以下块,这与CPU的数量相对应。当有嵌套的并行化时-- parallel for on for,parallel function on for等等--内部并行化会发生什么?我是OpenMP的新手,我考虑的情况可能相当简单--将一个向量与一个矩阵相乘。这是在两个嵌套的for循环中完成的。假设CPU<
我被所有不同的并行化循环的方法弄得不知所措,这个循环是这个程序中CPU最密集的函数的最外层的循环,它一直工作得很好,尽管速度很慢,没有并行化。我在Microsoft Visual Studio 2012上运行我的程序,我尝试了由和并发性库提供的并行for循环,但当我测试它时,任务管理器显示进程在不同数量