linux cpu ipi_linux ipi_ipi linux - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

【分享】嵌入式Linux系统中的CPU控制

嵌入式Linux系统中，Linux直接管理所有CPU。默认情况下，系统的目标是提高吞吐率，而不是实时性。为了保证实时性，可以根据应用场景，对CPU实行更加精确的控制。常见的办法有，进程CPU隔离、CPU亲和、中断CPU亲和、进程优先级。

02

【分享】扩展MPSoC中断

MPSoC是带ARM处理器和FPGA(PL)的SoC，包含4核A53及其常用外部模块（PS）。A53（PS）使用Arm GIC-400，属于GICv2架构。如果想了解GIC-400的具体细节，请参考文档APU GIC: CoreLink GIC-400 Generic Interrupt Controller, DDI 0471B, r0p1。

02

您找到你想要的搜索结果了吗？

是的

没有找到

Linux 系统性能评测基准系统配置及其原理

开发人员在高性能系统的性能调优过程中，经常会碰到各种背景的噪声干扰，从而使得收集的数据不够精确。本文主要从CPU 以及Linux操作系统的角度来分析各种噪声的来源以及消除方法。最终的目标是搭建基准平台，在特定的cpu上实现”0”干扰。

02

深入解析 TiFlash丨多并发下线程创建、释放的阻塞问题

TiFlash 初期存在一个棘手的问题：对于复杂的小查询，无论增加多少并发，TiFlash 的整机 CPU 使用率都远远不能打满。如下图：

02

深入理解Linux内核之进程唤醒

进程唤醒的主要调用链如上：会唤醒特定状态的进程（wake_up_process唤醒三种睡眠状态的进程，睡眠文章已经讲到），然后选择一个合适的cpu，接着会加入到cpu的运行队列以及进行唤醒抢占操作（这里还会有很多防止并发访问的自旋锁、关抢占、内存屏障等操作，大家自行研究）。

02

将 Linux 移植到 M1 Mac 真的太难了！

【CSDN 编者按】自去年苹果自研 M1 芯片发布之后，激发了无数用户的体验热情，与此同时，也吸引大批开发者在 M1 上开启探索模式。其中，国外一位资深操作系统移植专家 Hector Martin 发起了一项名为「Asahi Linux」项目，通过众筹的方式为苹果 M1 系列新机移植 Linux 系统。

02

关于虚拟机中IPI中断的思考

感谢intel的vt-x技术，让虚拟机大部分指令可以直接运行在CPU中，只有少部分敏感指令需要有VMM来模拟执行。其中，每个CPU的LAPIC接收到的中断是虚拟化的开销一个大头。

IOMMU(六)-post interrupt

post interrupt是intel提供的一种硬件机制，不用物理cpu从root模式exit到non-root模式就能把虚拟中断注入到non-root模式里，大概实现就是把虚拟中断写到post interrupt descriptor，预定义了一个中断号，然后给non-root模式下的cpu发送这个中断，non-root模式下cpu收到这个中断触发对virtual-apic page的硬件模拟，从post interrupt descriptor取出虚拟中断更新到virtual-apic page中，虚拟机中读virtual-access page，就能取到虚拟中断，处理中断，然后写EOI，触发硬件EOI virtulization，就能把virtual-apic page和post interrupt descriptor中数据清除。

01

Linux中断虚拟化（一）

王柏生资深技术专家，先后就职于中科院软件所、红旗Linux和百度，现任百度主任架构师。在操作系统、虚拟化技术、分布式系统、云计算、自动驾驶等相关领域耕耘多年，有着丰富的实践经验。著有畅销书《深度探索Linux操作系统》（2013年出版）。

03

IOMMU(六)-post interrupt

惠伟：IOMMU(五)-interrupt remmapingzhuanlan.zhihu.com

04

从一个softlock问题来谈谈Kernel IPI的实现

X86-64 架构，Kernel Ver：Centos7 3.10.0-693.el7.x86_64

郭健：进程切换分析之——TLB处理

进程切换是一个复杂的过程，本文不准备详细描述整个进程切换的方方面面，而是关注进程切换中一个小小的知识点：TLB的处理。为了能够讲清楚这个问题，我们在第二章描述在单CPU场景下一些和TLB相关的细节，第三章推进到多核场景，至此，理论部分结束。在第二章和第三章，我们从基本的逻辑角度出发，并不拘泥于特定的CPU和特定的OS，这里需要大家对基本的TLB的组织原理有所了解，具体可以参考本站的《TLB操作》一文。再好的逻辑也需要体现在HW block和SW block的设计中，在第四章，我们给出了linux4.4.6内核在ARM64平台上的TLB代码处理细节（在描述tlb lazy mode的时候引入部分x86架构的代码），希望能通过具体的代码和实际的CPU硬件行为加深大家对原理的理解。

03

Linux中断虚拟化（二）

王柏生资深技术专家，先后就职于中科院软件所、红旗Linux和百度，现任百度主任架构师。在操作系统、虚拟化技术、分布式系统、云计算、自动驾驶等相关领域耕耘多年，有着丰富的实践经验。著有畅销书《深度探索Linux操作系统》（2013年出版）。

01

进程切换分析（2）：TLB处理

进程切换是一个复杂的过程，本文不准备详细描述整个进程切换的方方面面，而是关注进程切换中一个小小的知识点：TLB的处理。为了能够讲清楚这个问题，我们在第二章描述在单CPU场景下一些和TLB相关的细节，第三章推进到多核场景，至此，理论部分结束。在第二章和第三章，我们从基本的逻辑角度出发，并不拘泥于特定的CPU和特定的OS，这里需要大家对基本的TLB的组织原理有所了解，具体可以参考本站的《TLB操作》一文。再好的逻辑也需要体现在HW block和SW block的设计中，在第四章，我们给出了linux4.4.6内核在ARM64平台上的TLB代码处理细节（在描述tlb lazy mode的时候引入部分x86架构的代码），希望能通过具体的代码和实际的CPU硬件行为加深大家对原理的理解。

01

软中断SOFTIRQ

软中断的出现和linux系统对中断的划分是分不开的。linux系统将整个中断处理过程分为了两部分，分别为上半部(Top Half)和下半部(Bottom Half)，之所以要这样分是因为关闭中断的时间不能过长，也就是在关闭中断期间尽可能少干事，否则影响整个系统的性能。所以linux系统将中断处理分为两部分，在上半部全程关闭中断，下半部打开中断。而在上半部主要干一些和硬件有关的操作，速度快，在下部分做一些耗时的操作。这样一来既能保证系统效率又能处理各种中断。

02

我的9年开源之路：395 Patch、20+Feature，背后只有努力与热爱

9月17日，在2021中国信通院主办的2021 OSCAR开源产业大会上，腾讯云虚拟化资深研发专家李万鹏凭借在Linux内核KVM子系统的长期及突出贡献，荣获“开源先锋人物”奖。腾源会也第一时间采访了李万鹏，以求向开源爱好者们传递这位开源达人成长背后的感悟及点滴。 2019年8月9号，对于李万鹏来说，是一个不同寻常的日子。那天早上，来自Paolo Zonzini（KVM总体维护者）的一封邮件让他久久不能平静。邮件中赫然写着的，“Formalize this by listing them as r

04

SMP多核启动

在 Linux系统中,对于多核的ARM芯片而言,在Biotron代码中,每个CPU都会识别自身ID,如果ID是0,则引导Bootloader和 Linux内核执行,如果ID不是0,则Biotron一般在上电时将自身置于WFI或者WFE状态,并等待CPU0给其发CPU核间中断或事件(一般通过SEV指令)以唤醒它。一个典型的多核 Linux启动过程如图20.6所示。被CPU0唤醒的CPUn可以在运行过程中进行热插拔,譬如运行如下命令即可卸载CPU1,并且将CPUI上的任务全部迁移到其他CPU中:

05

[Linux][mm]TLB shootdown和读取smaps对性能的影响

作者遇到了业务的一个性能抖动问题，在这里介绍一下它的原因和解决办法。分析 1，page fault 在Linux上，进程分配到的内存是虚拟内存，经过内核的页表管理，会把虚拟内存映射成物理内存。 a，在第一次访问内存的时候，会触发page fault，内核会给进程分配好内存，进程继续执行。 b，内核进行内存回收，可能会把进程的部分内存进行回收，swap到磁盘上，下次访问到再换回来。当然，这个在实际业务上未必会启用swap以防止性能下降。 c，进程自己判断，认为部分内存段时间内不会使用，会尝试把它归还给内核。它的好处是不需要修改进程的虚拟地址空间，只是把内存页面（page）归还给内核，下一次访问到的时候，会因为page fault而重新分配物理内存。另外需要注意的时候，处理page fault的过程中，需要持有进程的内存的锁（current->mm->mmap_sem）。 2，TLB shootdown 例如某服务器有40CPU，那么就意味着可以同时运行40个task。例如某业务有30个线程，且这30个线程都很忙，并行执行在30个CPU上。因为30个线程共享地址空间，它们使用的是相同的页表（page table）。所以在运行这30个线程的CPU上，会加载相同的页表。当代CPU为了加速TLB查找的速度，会使用cache，也就是说会把对应的页表项（page table entry）加载到TLB cache中。在运行的某一个时刻，某1个线程执行了上述的page fault的case 3，也就是执行了系统调用int madvise(void *addr, size_t length, MADV_DONTNEED)，想要释放1个page（4K大小），除了需要修改页表释放该page外，还需要确保CPU的TLB cache中也是没有该page的PTE的。因为如果TLB cache还有该PTE，那么CPU访问这个page就不会出错，而这个page已经被释放并分配给其他进程使用的话，就会造成安全问题。在多核场景下，这个问题就变得更加复杂了。除了运行madvise的线程之后，还需要确保另外的29个线程运行的CPU的TLB cache也是没有该PTE的。为了实现这种效果，需要当前的CPU通知另外的29个CPU，执行clflush或者重新加载cr3。这个通知的过程需要发送IPI（inter processor interrup）。发送IPI的这个过程，在x86上的体现就是需要CPU执行wrmsr指令，对应的操作是触发ICR。了解虚拟化的朋友应该知道，wrmsr这条指令在虚拟机上需要经过Hypervisor处理，性能更低一些。除此之外，在执行madvise的过程中，还需要持有当前进程的内存的锁（current->mm->mmap_sem），而且这个锁的粒度比较大。而jemalloc库，默认情况下，则会释放过期的内存，调用madvise(void *addr, size_t length, MADV_DONTNEED)。 3，smaps/smaps_rollup cat /proc/PID/smaps，可以查看进程的每一段VMA信息。

02

kvm timer虚拟化

惠伟：linux time和kvm time虚拟化综述zhuanlan.zhihu.com

00

kvm timer虚拟化

在这篇中遗留了几个问题，先尝试回答一下，不一定准确，代码太多，看不过来，全靠猜测，代码的历史很长，都是智慧的结晶，一时半会消化不了很正常。

01

Linux数据报文的来龙去脉

作为网络领域的开发人员，我们经常要与Linux的数据报文打交道，一定要搞清楚数据报文是从何而来，又是如何离去。以前针对这个主题写过一些文章（主要是从源码角度），这次会更重视流程示意图（在细节上必然有所简化），争取在一篇文章中，就让大家理清数据报文的来龙去脉。

09

CPU快表

https://blog.csdn.net/ByteDanceTech/article/details/104765810

00

Linux数据报文的来龙去脉

作为网络领域的开发人员，我们经常要与Linux的数据报文打交道，一定要搞清楚数据报文是从何而来，又是如何离去。以前针对这个主题写过一些文章（主要是从源码角度），这次会更重视流程示意图（在细节上必然有所简化），争取在一篇文章中，就让大家理清数据报文的来龙去脉。

03

x86 kvm和qemu虚拟化介绍

简单说一下自己对x86平台虚拟化的理解，intel有SDM手册，代码都是公开的，难度比较大，理解起来困难，网上有大量优秀博客讲解虚拟化，引用了大量手册和代码，还是很难看懂。个人觉得理解虚拟化不能一上来就看很详细的手册和代码，虚拟化有点绕，先闭上眼睛想想大的道理，掌握了大的道理，再看手册和代码加深理解，否则很容易迷失，对虚拟化的理解只流于表面。

02

腾讯云虚拟化：坚定的开源主义者

点击上方“腾讯云TStack”关注我们获取最in云端资讯和海量技术干货 “只要有足够多的眼睛，就可以让所有问题浮出水面。” 在开源社区，以开源理念的发起者之一、Linux创始人林纳斯·托瓦兹名字来命名的林纳斯定律为不少开发者所共鸣。也正是这种共创共享的精神内核，让开源自1988年发展至今，并逐步成为全球IT软件的重要组成。根据全球最大开源代码托管平台 GitHub 年度报告数据显示，截至 2019 年 GitHub 托管仓库已有 1.4 亿，2019 年新增仓库 400 万个，创建第一个项目的

04

x86中断和中断虚拟化

网上有很多写中断虚拟化的博客，讲qemu/kvm是怎么模拟中断的，贴了大段大段的代码，看起来很吃力，对于一个虚拟化新手来说太困难太困难，我这儿写点简单的，讲讲中断和中断虚拟化的原理和来龙去脉，争取让大家好理解一点，也同时加深自己的理解，中断和中断虚拟机实在太绕了，直接看代码那就是看天书，先掌握原理和设计再看代码会好一点，争取后面再写写细节和代码分析，一步一步来搞定它。

01

上下文切换，你确定了解吗？

听到上下文切换，大家第一反应肯定是：一定要减少这货出现的次数。确实上下文切换对性能的影响显而易见，但有时又无法完全避免，这就要求我们对上下文性能损耗了然于胸，才能更准确地评估系统性能。另外，现在云厂商提供的机器种类如此之多，虚拟机在这方面是否有区别。以上都需要有科学的方法来衡量上下文的耗时，进而帮助系统评估以及机型选择。

GICv3驱动初始化

linux驱动支持GICv1, GICv2, GICv3, GICv4驱动，本节我们重点来描述下GICv3的驱动初始化，结合ARM-Cortex平台详细描述

03

有种中断是软的

Workqueue 工作队列是利用内核线程来异步执行工作任务的通用机制，利用进程上下文来执行中断处理中耗时的任务，因此它允许睡眠。而 Softirq 和 Tasklet 在处理任务时不能睡眠。Softirq 是内核中常见的一种下半部机制，适合系统对性能和实时响应要求很高的场合，比如网络子系统，块设备，高精度定时器，RCU 等。

04

[kvm][qemu]vm exit的优化

前言：减少vm exit的次数，提高虚拟机的性能。本文对比几种场景，讨论kvm的性能优化方案。本分方案中，host和guest都使用Linux4.4。相比更早的Linux版本，Linux4.4的虚拟化更加完善。如果有不了解的朋友，可以了解一下apicv技术，和相关的posted-interrupt和PV-EOI。本文中，工具使用systemtap，获取到vm exit的reason和次数。分析： 1，网卡虚拟化初始条件： a，为了避免外部中断带来的干扰，把物理网卡的中断绑定到物理机的CPU0

谢宝友: 深入理解RCU之七：分级RCU实现

本文是为那些希望非常深层次的理解RCU的骨灰级黑客准备的。这些黑客应当首先阅读《深入理解RCU》系列文章的第1~6篇。骨灰级代码狂也可能有兴趣直接看看本文。

02

kvm timer导致exit过多的解决办法

惠伟：linux time和kvm time虚拟化综述zhuanlan.zhihu.com

00

宋宝华：谈一谈Linux让实时/高性能任务独占CPU的事

本文主要讨论在高实时要求、高效能计算、DPDK等领域，Linux如何让某一个线程排他性独占CPU；独占CPU涉及的线程、中断隔离原理；以及如何在排他性独占的情况下，甚至让系统的timer tick也不打断独占任务，从而实现最低的延迟抖动。

02

解决那些千奇百怪的 Kernel panic - not syncing: VFS: Unable to mount root fs on unknown-block 错误

设备：全志T113 + eMMC，SDC2 错误描述：[EXFAT] trying to mount... 后 Panic，显示 MMC 分区表

01

[ 物联网篇 ] 28 - Linux ES7210 Driver 调试

项目开发过程中，由于Broadcom平台音频数字接口比较少，所以采用模拟麦克风作为输入端，经顺芯ES7210 ADC 转换送至Broadcom PCM 数字音频接口。

04

宋宝华：为了不忘却的纪念，评Linux 5.13内核（上集）

5.14-rc6了，看起来5.14也快发布了。而我5.13的总结还没有写出，我早觉得有写一点东西的必要了，这虽然于搬砖的码农毫不相干，但在追求上进的工程师那里，却大抵只能如此而已。为了不忘却的纪念，我们列出5.13内核的10个激动人心的新特性。上集先谈4个：

04

FPGA上的视觉 SLAM

SLAM（同步定位和地图绘制）在自动驾驶、AGV 和无人机等各种应用中引起了人们的广泛关注。尽管目前有很多优秀的 SLAM 项目可以参考，但是他们的复杂性（高性能）及依赖性（依赖于许多外部库），使得它们无法移植到简单的平台（例如嵌入式系统）。

04

TLB flush 在 OpenCloudOS 中的执行机制与优化实现

TLB 是一种内存高速缓存，用于存储虚拟内存到物理内存的最新映射关系，它是芯片内存管理单元(MMU) 的一部分，驻留在 CPU 和 CPU 缓存之间、CPU 缓存和主存之间或者不同级别的多级缓存之间，通过查找 TLB 缓存，可以减少访问用户查找物理内存地址所需的时间。

06

Linux Kernel运行时安全检测之LKRG-原理篇

许庆伟：龙蜥社区eBPF技术探索SIG组 Maintainer & Linux Kernel Security Researcher

03

【调试】ftrace(一)基本使用方法

Ftrace是Linux Kernel的官方tracing系统，支持Function trace、静态tracepoint、动态Tracepoint的跟踪，还提供各种Tracer，用于统计最大irq延迟、最大函数调用栈大小、调度事件等。

04

Linux 进程管理之CFS负载均衡

前面的调度学习都是默认在单个CPU上的调度策略。我们知道为了CPU之间减少“干扰”，每个CPU上都有一个任务队列。运行的过程种可能会出现有的CPU“忙的一笔”，有的CPU“闲的蛋疼”，于是便需要负载均衡。

01

一些常用场景的perf分析方法（笔记积累，持续更新）

perf record -ag -e irq:,sched:,probe:,timer:,irq_vectors:call_function*

03

Boot之vxWorks7启动顺序

之前遍历过使用WorkBench的VIP编译的Vx69镜像文件vxWorks，今天照猫画虎，以32位SMP模式下的Intel处理器为例，走一遍Vx7-2107的VxWorks执行顺序。通过对比可以看到，69和7的执行顺序基本一致

01

一些小巧的IP

目前，越来越多的工程师会用到Vivado IP Integrator（IPI）。它的强大之处在于通过实例化和互连IP构建复杂的设计。现在的IPI中，不仅可以添加Vivado IP，还可以添加用户代码，使其以Block的形式出现在IPI中（IPI的设计被称之为Block Design）。同时，IPI提供的Designer Assistance功能也进一步提升了工程师的工作效率。

02

【经验分享】AMD Embedded R2000 处理器在极限负载下的Linux实时性能测试结果

之前使用FFT运算、C程序编译，网络通信作为负载，测试了AMD Embedded R2000 在Linux下的实时性能。

01

性能测试必备知识（6）- 如何查看“CPU 上下文切换”

https://www.cnblogs.com/poloyy/category/1806772.html

01

IOMMU(五)-interrupt remmaping

通过DMA写物理地址0x0FEE_XXXX来产生中断，PCI config space中有MSI Address和Data寄存器，驱动配置这两个寄存器，Address寄存器中有Destination ID，表示Local APIC ID，Address寄存器所有字段组合起来就是x0FEE_XXXX，Data寄存器有vector号，表示中断号。

01

每天学一个 Linux 命令（117）：atop

atop 命令是一款监控 Linux 系统资源与进程的工具，非内部命令，需要安装。

03

Linux下0号进程的前世(init_task进程)今生(idle进程)----Linux进程的管理与调度（五）【转】

Linux下有3个特殊的进程，idle进程(PID = 0), init进程(PID = 1)和kthreadd(PID = 2)

03

IOMMU(五)-interrupt remmaping

惠伟：IOMMU(四)-dma remappingzhuanlan.zhihu.com

00

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭