前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >CPU亲和性设置视频解析,代码示例 sched_setaffinity sched_getaffinity, CPU_ZERO、CPU_SET、CPU_IS

CPU亲和性设置视频解析,代码示例 sched_setaffinity sched_getaffinity, CPU_ZERO、CPU_SET、CPU_IS

原创
作者头像
爱串门的小马驹
发布于 2024-09-07 02:44:20
发布于 2024-09-07 02:44:20
65700
代码可运行
举报
文章被收录于专栏:集合通信集合通信
运行总次数:0
代码可运行

视频教程在这:

cpu亲和性设置,NCCL,sched_setaffinity sched_getaffinity,CPU_ZERO、SET、ISSET、linux_哔哩哔哩_bilibili

一、CPU亲和性简介

CPU亲和性(CPU Affinity)设置是操作系统中一个重要的性能优化手段,它允许程序或进程被绑定到特定的CPU核心上运行。这样做的好处包括减少缓存未命中、降低线程迁移(context switching)的开销,以及提高缓存的局部性(cache locality),从而可能提升程序的整体性能。

对于我们NCCL集合通信,也用到亲和性设置,通过将需要与GPU交互的CPU设置为距离近的CPU核心,来优化GPU和CPU间的通信路径

NCCL通信时也用到亲和性设置,来优化GPU和CPU间的通信路径。

二、Linux系统中CPU亲和性的设置方法

Linux系统中,CPU亲和性可通过sched_setaffinity系统调用进行设置,可以将当前进程或线程绑定到一组特定的CPU上。

2.1 sched_setaffinity()和sched_getaffinity

这里大家重点了解两个函数:sched_setaffinity()和sched_getaffinity

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include <sched.h>  

int sched_getaffinity(pid_t pid, size_t cpusetsize, cpu_set_t *mask);
int sched_setaffinity(pid_t pid, size_t cpusetsize, const cpu_set_t *mask);

sched_setaffinity():设置进程或线程的CPU亲和性 sched_ getaffinity():获取进程或线程的CPU亲和性

参数说明

pid:要获取 CPU 亲和性的进程或线程的 ID。对于当前进程,可以使用 0。 cpusetsize:cpu_set_t 类型变量的大小,通常通过 sizeof(cpu_set_t) 获得。 mask:指向 cpu_set_t 类型的指针,用于存储返回的 CPU 亲和性掩码。在这个掩码中,每个位代表一个 CPU,如果某位被设置(即值为 1),则表示该进程或线程可以被调度到对应的 CPU 上运行。

2.2 CPU_ZERO、CPU_SET、CPU_ISSET、CPU_CLR

CPU_ZERO

CPU_ZERO宏用于初始化cpu_set_t类型的变量,将其所有位都设置为0。这表示在初始状态下,没有CPU核心被选中。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cpu_set_t cpuset;  
CPU_ZERO(&cpuset); // 初始化cpuset,所有位都设为0

CPU_SET

CPU_SET宏用于将cpu_set_t类型变量中指定的CPU核心对应的位设置为1。这表示该CPU核心被选中,进程或线程可以运行在该核心上。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 CPU_SET(1, &cpuset); // 将cpuset中CPU 1对应的位设置为1

CPU_CLR

CPU_CLR宏用于将cpu_set_t类型变量中指定的CPU核心对应的位清除(即设置为0)。这表示该CPU核心不再被选中。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 CPU_CLR(1, &cpuset); // 将cpuset中CPU 1对应的位清除

CPU_ISSET

CPU_ISSET宏用于检查cpu_set_t类型变量中指定的CPU核心对应的位是否被设置(即是否为1)。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
if (CPU_ISSET(1, &cpuset)) {  
    // 如果cpuset中CPU 1对应的位被设置,则执行此代码块  
}

三、代码示例

获取当前进程的亲和性,并将亲和性设置为CPU0和CPU1。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include <stdio.h>  // 引入标准输入输出头文件  
#include <stdlib.h> // 引入标准库头文件,用于exit函数  
#include <sched.h>  // 引入调度头文件,提供CPU亲和性相关的函数和宏  
#include <string.h> // 虽然在这个示例中未直接使用,但通常用于字符串操作  
  
int main() {    
    cpu_set_t cpuset;  // 定义一个cpu_set_t类型的变量cpuset,用于表示CPU集合  
    size_t cpusetsize = sizeof(cpu_set_t);  // 获取cpu_set_t类型的大小,用作sched_setaffinity和sched_getaffinity的参数  

    // 验证并打印当前进程的CPU亲和性  
    cpu_set_t get_cpuset;  // 定义一个变量get_cpuset用于获取当前进程的CPU亲和性  
    CPU_ZERO(&get_cpuset);  // 初始化get_cpuset  
  
    // 尝试获取当前进程的CPU亲和性  
    if (sched_getaffinity(0, cpusetsize, &get_cpuset) == -1) {    
        perror("sched_getaffinity failed");  // 如果获取失败,则打印错误信息  
        exit(EXIT_FAILURE);  // 并以失败状态退出程序  
    }    
  
    // 打印当前进程的CPU亲和性  
    printf("Current CPU affinity: ");    
    for (size_t i = 0; i < CPU_SETSIZE; i++) {  // 遍历CPU_SETSIZE范围内的所有CPU编号  
        if (CPU_ISSET(i, &get_cpuset)) {  // 检查get_cpuset中对应CPU的位是否被设置  
            printf("CPU %zu ", i);  // 如果被设置,则打印该CPU编号  
        }    
    }    
    printf("\n");  // 换行  

  
    // 初始化CPU集合,将所有位清零  
    CPU_ZERO(&cpuset);    
  
    // 设置CPU亲和性,将CPU 0和CPU 1的位设置为1,表示希望将进程绑定到这两个CPU上  
    CPU_SET(0, &cpuset);    
    CPU_SET(1, &cpuset);    
  
    // 尝试设置当前进程的CPU亲和性  
    if (sched_setaffinity(0, cpusetsize, &cpuset) == -1) {    
        perror("sched_setaffinity failed");  // 如果设置失败,则打印错误信息  
        exit(EXIT_FAILURE);  // 并以失败状态退出程序  
    }    
  
    // 验证并打印当前进程的CPU亲和性  
    CPU_ZERO(&get_cpuset);  // 初始化get_cpuset  
  
    // 尝试获取当前进程的CPU亲和性  
    if (sched_getaffinity(0, cpusetsize, &get_cpuset) == -1) {    
        perror("sched_getaffinity failed");  // 如果获取失败,则打印错误信息  
        exit(EXIT_FAILURE);  // 并以失败状态退出程序  
    }    
  
    // 打印当前进程的CPU亲和性  
    printf("Current CPU affinity: ");    
    for (size_t i = 0; i < CPU_SETSIZE; i++) {  // 遍历CPU_SETSIZE范围内的所有CPU编号  
        if (CPU_ISSET(i, &get_cpuset)) {  // 检查get_cpuset中对应CPU的位是否被设置  
            printf("CPU %zu ", i);  // 如果被设置,则打印该CPU编号  
        }    
    }    
    printf("\n");  // 换行  
  
    // 假设我们想要清除CPU 1的亲和性设置(仅作为演示,不会实际影响进程)  
    CPU_CLR(1, &cpuset);  // 修改cpuset变量,清除CPU 1的位  
  
    // 注意:这里的CPU_CLR只是修改了cpuset变量,并不会影响已经设置的进程亲和性  
    // 如果要重新设置进程的CPU亲和性,需要再次调用sched_setaffinity  
  
    // (可选)重新打印修改后的cpuset,但请注意它不会反映进程的当前亲和性  
    printf("Modified cpuset (not applied to process): ");    
    for (size_t i = 0; i < CPU_SETSIZE; i++) {  // 再次遍历CPU_SETSIZE范围内的所有CPU编号  
        if (CPU_ISSET(i, &cpuset)) {  // 检查cpuset中对应CPU的位是否被设置  
            printf("CPU %zu ", i);  // 如果被设置,则打印该CPU编号  
        }    
    }    
    printf("\n");  // 换行  
  
    return 0;  // 程序正常结束  
} 

程序输出结果:

我们在ubuntu用g++编译并运行,输出三行信息:

1、没有设置CPU亲和性前,当前进程可以在CPU0、CPU1、CPU2、CPU3上运行。

2、将当前进程的亲和性设置为CPU0和CPU1,第二行输出进程可以在CPU0、CPU1上运行。

3、是利用 CPU_CLR修改cpuset变量,清除CPU 1的位,并输出cpuset。(注意,只是改变了变量值,并没有对亲和性进行设置)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Linux中CPU亲和性(affinity)
超线程技术(Hyper-Threading): 就是利用特殊的硬件指令,把两个逻辑内核(CPU core)模拟成两个物理芯片,(一个核模拟出两个核?)
刘盼
2023/12/04
8811
Linux中CPU亲和性(affinity)
控制核心分配:利用CPU亲和性最大化速度和效率
CPU亲和性是指将特定的计算资源(如处理器核心)与特定的任务或线程相关联的能力。它允许系统管理员或开发人员指定将特定任务或线程绑定到特定的处理器核心上运行,以提高系统性能和效率。通过控制核心分配和利用CPU亲和性,可以确保任务或线程在运行过程中始终与特定的处理器核心保持关联,避免频繁的核心切换和资源争用,从而提高处理速度和效率。
Lion 莱恩呀
2024/09/28
3200
控制核心分配:利用CPU亲和性最大化速度和效率
CPU 绑定
现在大家使用的基本上都是多核cpu,一般是4核的。平时应用程序在运行时都是由操作系统管理的。操作系统对应用进程进行调度,使其在不同的核上轮番运行。
233333
2022/05/10
1.5K0
进程绑定CPU简单应用
sched_setaffinity, sched_getaffinity, CPU_CLR, CPU_ISSET, CPU_SET, CPU_ZERO - set and get a process's CPU affinity mask
一见
2018/08/07
8990
Linux 进程管理之任务绑定
在多核结构中,每个核有各自的L1缓存,相同类型的核被划分在同一个cluster中,而不同cluster之间又有共用的L2缓存。讲负载均衡的时候我们讲过一个进程在核之间来回切换的时候,各个核之间的缓存命中率会降低,所以,将进程与 CPU 进行绑定可以提高 CPU 缓存的命中率,从而提高性能。这种绑定关系就叫做:进程的 CPU 亲和性。
刘盼
2021/07/05
1.7K0
Linux 进程管理之任务绑定
一文读懂 | 进程怎么绑定 CPU
所以,将进程与 CPU 进行绑定可以提高 CPU 缓存的命中率,从而提高性能。而进程与 CPU 绑定被称为:CPU 亲和性。
用户7686797
2021/06/15
3.6K0
一文读懂 | 进程怎么绑定 CPU
【AI移动端算法优化】四,移动端arm cpu优化学习笔记之绑定cpu(cpu affinity)
本文主要内容是介绍移动端优化会涉及到的绑定cpu(cpu affinity)[2,3]的概念和相关验证实验。
BBuf
2020/05/16
2.1K0
Nginx(5):进程绑定CPU:从nginx源码里给你刨功能出来
超线程技术(Hyper-Threading):就是利用特殊的硬件指令,把两个逻辑内核(CPU core)模拟成两个物理芯片, 让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了CPU的闲置时间,提高的CPU的运行效率。 我们常听到的双核四线程/四核八线程指的就是支持超线程技术的CPU.
看、未来
2021/10/09
1.5K0
Nginx(5):进程绑定CPU:从nginx源码里给你刨功能出来
多核环境下cache line的测试
前阵子接触到一道关于数组内部链表(多用于内存池技术)的数据结构的题, 这种数据结构能够比普通链表在cache中更容易命中, 理由很简单, 就是因为其在地址上是连续的(=.=!), 借这个机会, 就对cpu cache进行了一个研究, 今天做一个简单的分享, 首先先来普及一下cpu cache的知识, 这里的cache是指cpu的高速缓存. 在我们程序员看来, 缓存是一个透明部件. 因此, 程序员通常无法直接干预对缓存的操作. 但是, 确实可以根据缓存的特点对程序代码实施特定优化, 从而更好地利用高速缓存. 
猿人谷
2018/01/17
1.6K0
CPU绑核的意义
进程或者线程绑定到某个CPU Core,仍然可能会有线程或者进程切换的发生,如果想到达到进一步减少其他进程对于该进程或者线程影响,可以采取把CPU Core从Linux内核调度中剥离出来。Linux内核提供isolcpus,对于有4个CPU core的系统,在启动时候加入isolcpus=2,3,那么系统启动后将不会使用CPU3,CPU4.这里的不适用不是绝对的,但是可以通过taskset命令来设置
用户4700054
2022/08/17
3.3K0
CPU绑核的意义
获取cpu频率的代码
taskset是linux自带的一个命令,可用来将进程绑定到指定CPU 相关的函数有: sched_setaffinity, CPU_CLR, CPU_ISSET, CPU_SET, CPU_ZERO
一见
2018/08/10
2.8K0
[linux][x86]LOCK指令的影响
前言: 一般多线程并行操作,对个别的变量需要使用原子操作,经常用到__sync_fetch_and_add类似的函数,来避免CPU操作各自的cache没有同步内存而造成的数据数错。 在x86平台上,反汇编__sync_fetch_and_add就可以看到,实际上是lock addq $0x1,(%rax)。 如果多个CPU并行使用__sync_fetch_and_add,会不会造成性能问题呢?LOCK指令的影响范围是多少呢?同一个CORE的两个THREAD,同一个SOCKET的两个CORE,以及两个SOCKET之间呢? 分析: 1,sample code 手写一段代码,两个thread分别可以绑定在两个CPU上,一起跑__sync_fetch_and_add,看看时间上是不是会受到影响。需要注意的是“long padding[100]; // avoid cache false-sharing”这行,加上padding用来避免CPU cache的false-sharing问题。 #include <sched.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <stdint.h> #include <sys/time.h> #include <pthread.h> void bench_atomic(long *l) { long loop; struct timeval start, end; suseconds_t eplased = 0; gettimeofday(&start, NULL); // benchmark for (loop = 0; loop < 0x20000000; loop++) { __sync_fetch_and_add(l, 1); } gettimeofday(&end, NULL); eplased = (end.tv_sec - start.tv_sec)*1000*1000 + end.tv_usec - start.tv_usec; printf("ATOMICC test %ld msec\n", eplased); } void *routine(void *p) { long *l = (long*)p; cpu_set_t my_set; CPU_ZERO(&my_set); CPU_SET(*l, &my_set); sched_setaffinity(0, sizeof(cpu_set_t), &my_set); *l = 0; bench_atomic(l); } int main(int argc, char **argv) { pthread_t p0, p1; long cpu0 = 4; long padding[100]; // avoid cache false-sharing long cpu1 = 8; if (argc != 3) { printf("%s CPU CPU\n", argv[0]); return 0; } cpu0 = atoi(argv[1]); cpu1 = atoi(argv[2]); padding[0] = cpu0; printf("main thread run on CPU %ld, worker thread run on CPU %ld and CPU %ld\n", padding[0], cpu0, cpu1); bench_atomic(&padding[0]); pthread_create(&p0, NULL, routine, &cpu0); pthread_create(&p1, NULL, routine, &cpu1); pthread_join(p0, NULL); pthread_join(p1, NULL); printf("result %ld and CPU %ld\n", cpu0, cpu1); return 0; } 2, cpu topology 使用lscpu判断cpu的分布
皮振伟
2018/11/30
2.2K0
[linux][x86]LOCK指令的影响
Linux线程调度
在Linux中,线程是由进程来实现,线程就是轻量级进程( lightweight process ),因此在Linux中,线程的调度是按照进程的调度方式来进行调度的,也就是说线程是调度单元。Linux这样实现的线程的好处的之一是:线程调度直接使用进程调度就可以了,没必要再搞一个进程内的线程调度器。在Linux中,调度器是基于线程的调度策略(scheduling policy)和静态调度优先级(static scheduling priority)来决定那个线程来运行。
用户6280468
2022/04/18
4.4K0
【Linux】多进程高并发设计框架示例
多进程高并发设计框架 建议根据cpu核心数量来设置子进程的数量。 建议将对应某一进程绑定到某一cpu上。(cpu亲缘性) 优点: 充分利用多核系统的并发处理能力。(多个进程在多个不同的核心上运行) 负载均衡。 职责明确,管理进程仅负责管理,工作进程负责处理业务逻辑。 示例: multip_process.c #define _GNU_SOURCE #include <sched.h> #include <stdio.h> #include <stdlib.h> #include <unistd
半生瓜的blog
2023/05/13
7390
【Linux】多进程高并发设计框架示例
Ingress-nginx reload 性能提升实践
nginx 是企业中最常用的 7 层负责均衡产品之一,在企业实际业务运行中起到非常重要的作用。自 2004 年推出,nginx 已经有 10 余年的历史,广泛应用于大型成熟项目。
腾讯专有云
2022/06/24
1.9K0
Ingress-nginx reload 性能提升实践
近期工作小结
近期在做Android双系统开发和维护工作,可能以后也不会涉及到这块了,做个记录!刚接触还是很难的,所以以后有同学如果能做到这块,不要着急,任何技术都是需要时间积累,就这么三两个月能开始修改内核的代码,多少还是觉得有些意思的!
呱牛笔记
2023/05/02
3560
近期工作小结
linux内核调度算法(3)–多核系统的负载均衡
多核CPU现在很常见,那么问题来了,一个程序在运行时,只在一个CPU核上运行?还是交替在多个CPU核上运行呢?Linux内核是如何在多核间调度进程的呢?又是内核又是CPU核,两个核有点绕,下面称CPU处理器来代替CPU核。
陶辉
2019/06/21
4.1K0
docker cgroup技术之cpu和cpuset
  在centos7的/sys/fs/cgroup下面可以看到与cpu相关的有cpu,cpuacct和cpuset 3个subsystem。cpu用于对cpu使用率的划分;cpuset用于设置cpu的亲和性等,主要用于numa架构的os;cpuacct记录了cpu的部分信息。对cpu资源的设置可以从2个维度考察:cpu使用百分比和cpu核数目。前者使用cpu subsystem进行配置,后者使用cpuset subsystem进程配置。首先看cpu subsystem的用法
charlieroro
2020/03/24
2.2K0
docker cgroup技术之cpu和cpuset
linux应用如何进行cpu绑定
所谓cpu绑定,其实就是对进程或线程设置相应的cpu亲和力(affinity),确保进程或线程只会在设置了相应标志位的cpu上运行,进而提高应用对cpu的使用效率。如果应用可以在多个cpu上运行,操作系统会在cpu之间频繁切换应用,引起cpu缓存失效,降低缓存的命中率,导致cpu的使用效率下降。所以,如果使用cpu绑定技术,在一定程度上会避免上述问题,提升系统性能,类似技术还有gpu绑定、mic绑定等等。 There are only two hard things in Computer Science
俊采
2018/06/07
3.4K0
Linux 性能调优之 CPU 亲和性配置
不必太纠结于当下,也不必太忧虑未来,当你经历过一些事情的时候,眼前的风景已经和从前不一样了。——村上春树
山河已无恙
2024/05/20
1.1K0
Linux 性能调优之 CPU 亲和性配置
相关推荐
Linux中CPU亲和性(affinity)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验