Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Linux ptrace 的实现

Linux ptrace 的实现

作者头像
theanarkh
发布于 2021-12-09 06:46:16
发布于 2021-12-09 06:46:16
1.6K00
代码可运行
举报
文章被收录于专栏:原创分享原创分享
运行总次数:0
代码可运行

前言:ptrace 是 Linux 内核提供的非常强大的系统调用,通过 ptrace 可以实现进程的单步调试和收集系统调用情况。比如 strace 和 gdb 都是基于 ptrace 实现的,strace 可以显示进程调用了哪些系统调用,gdb 可以实现对进程的调试。本文介绍这些工具的底层 ptrace 是如何实现的。这里选用了 1.2.13 的早期版本,原理是类似的,新版内核代码过多,没必要陷入过多细节中。

1 进程调试

ptrace 系统调用的实现中包含了很多功能,首先来看一下单步调试的实现。通过 ptrace 实现单步调试的方式有两种。

1. 父进程执行 fork 创建一个子进程,通过 ptrace 设置子进程为 PF_PTRACED 标记,然后执行 execve 加载被调试的程序。

2. 通过 ptrace attach 到指定的 pid 完成对进程的调试(控制)。

首先看一下第一种的实现。

1.1 方式1

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pid_t pid = fork();// 子进程if (pid == 0) {
    ptrace(PTRACE_TRACEME,0,NULL,NULL);
    // 加载被调试的程序
    execve(argv[1], NULL, NULL);}

执行 fork 创建子进程后,通过 ptrace 的 PTRACE_TRACEME 指示操作系统设置子进程为被调试(设置 PF_PTRACED 标记)。来看一下这一步操作系统做了什么事情。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
asmlinkage int sys_ptrace(long request, long pid, long addr, long data){
    if (request == PTRACE_TRACEME) {
        current->flags |= PF_PTRACED;
        return 0;
    }}

这一步非常简单,接着看 execve 加载程序到内存执行时又是如何处理的。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
int do_execve(char * filename, char ** argv, char ** envp, struct pt_regs * regs) {
    // 加载程序
    for (fmt = formats ; fmt ; fmt = fmt->next) {
        int (*fn)(struct linux_binprm *, struct pt_regs *) = fmt->load_binary;
        retval = fn(&bprm, regs);
    }}

do_execve 逻辑非常复杂,不过我们只关注需要的就好。do_execve 通过钩子函数加载程序,我们看看 formats 是什么。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
struct linux_binfmt {
    struct linux_binfmt * next;
    int *use_count;
    int (*load_binary)(struct linux_binprm *, struct  pt_regs * regs);
    int (*load_shlib)(int fd);
    int (*core_dump)(long signr, struct pt_regs * regs);};
static struct linux_binfmt *formats = &aout_format;int register_binfmt(struct linux_binfmt * fmt){    struct linux_binfmt ** tmp = &formats;

    if (!fmt)
        return -EINVAL;
    if (fmt->next)
        return -EBUSY;
    while (*tmp) {
        if (fmt == *tmp)
            return -EBUSY;
        tmp = &(*tmp)->next;
    }
    *tmp = fmt;
    return 0;   
}

可以看到 formats 是一个链表。可以通过 register_binfmt 函数注册节点。那么谁调用了这个函数呢?

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
struct linux_binfmt elf_format = {
    NULL, NULL, load_elf_binary, load_elf_library, NULL};int init_module(void) {
    register_binfmt(&elf_format);
    return 0;}

所以最终调用了 load_elf_binary 函数加载程序。同样我们只关注相关的逻辑。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
if (current->flags & PF_PTRACED)
        send_sig(SIGTRAP, current, 0);

load_elf_binary 中会判断如果进程设置了 PF_PTRACED 标记,那么会给当前进程发送一个 SIGTRAP 信号。接着看信号处理函数的相关逻辑。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
if ((current->flags & PF_PTRACED) && signr != SIGKILL) {
    current->exit_code = signr;
    // 修改当前进程(被调试的进程)为暂停状态
    current->state = TASK_STOPPED;
    // 通知父进程
    notify_parent(current);
    // 调度其他进程执行
    schedule();}

所以程序被加载到内存后,根本没有机会执行就直接被修改为暂停状态了,接下来看看 notify_parent 通知父进程干什么。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
void notify_parent(struct task_struct * tsk){   
    // 给父进程发送 SIGCHLD 信号
    if (tsk->p_pptr == task[1])
        tsk->exit_signal = SIGCHLD;
    send_sig(tsk->exit_signal, tsk->p_pptr, 1);
    wake_up_interruptible(&tsk->p_pptr->wait_chldexit);}

父进程收到信号后,可以通过 sys_ptrace 控制子进程,sys_ptrace 还提供了很多功能,比如读取子进程的数据。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
// pid 为子进程 id
num = ptrace(PTRACE_PEEKUSER, pid, ORIG_RAX * 8, NULL);

这个就不展开了,主要是内存的校验和数据读取。这里讲一下 PTRACE_SINGLESTEP 命令,这个命令控制子进程单步执行的。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
case PTRACE_SINGLESTEP: {  /* set the trap flag. */
        long tmp;
        child->flags &= ~PF_TRACESYS;
        // 设置 eflags 的单步调试 flag
        tmp = get_stack_long(child, sizeof(long)*EFL-MAGICNUMBER) | TRAP_FLAG;
        put_stack_long(child, sizeof(long)*EFL-MAGICNUMBER,tmp);
        // 修改子进程状态为可执行
        child->state = TASK_RUNNING;
        child->exit_code = data;
        return 0;
}

PTRACE_SINGLESTEP 让子进程重新进入运行状态,但是有一个很关键的是,设置好了单步调试 flag。我们看看 trap flag 是什么。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
A trap flag permits operation of a processor in single-step mode. If such a flag is available, debuggers can use it to step through the execution of a computer program.

也就是说,子进程执行一个指令后,就会被中断,然后系统会给被调试进程发送 SIGTRAP 信号。同样,被调试进程在信号处理函数里,通知父进程,从而控制权又回到了父进程手中,如此循环。

1.2 方式2

除了开始时通过 ptrace 设置进程调试,也可以通过 ptrace 动态设置调试进程的能力,具体是通过 PTRACE_ATTACH 命令实现的。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
if (request == PTRACE_ATTACH) {
        // 设置被调试标记
        child->flags |= PF_PTRACED;
        // 设置和父进程的关系
        if (child->p_pptr != current) {
            REMOVE_LINKS(child);
            child->p_pptr = current;
            SET_LINKS(child);
        }
        // 给被调试进程发送 SIGSTOP 信号
        send_sig(SIGSTOP, child, 1);
        return 0;
}

前面已经分析过,信号处理函数里会设置进程为暂停状态,然后通知主进程,主进程就可以控制子进程,具体和前面流程一样。

2 跟踪系统调用

ptrace 处理追踪进程执行过程之外,还可以实现跟踪系统调用。具体是通过 PTRACE_SYSCALL 命令实现。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
case PTRACE_SYSCALL:case PTRACE_CONT: {    long tmp;
    // 设置 PF_TRACESYS 标记
    if (request == PTRACE_SYSCALL)
        child->flags |= PF_TRACESYS;
    child->exit_code = data;
    child->state = TASK_RUNNING;
    // 清除 trap flag 标记
    tmp = get_stack_long(child, sizeof(long)*EFL-MAGICNUMBER) & ~TRAP_FLAG;
    put_stack_long(child, sizeof(long)*EFL-MAGICNUMBER,tmp);
    return 0;}

看起来很简单,就是设置了一个新的标记 PF_TRACESYS。看看这个标记有什么用。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
// 调用 syscall_trace 函数1:  call _syscall_trace
    movl     movl ORIG_EAX(%esp),%eax
    // 调用系统调用
    call _sys_call_table(,%eax,4)
    movl %eax,EAX(%esp)     # save the return value
    movl _current,%eax
    movl errno(%eax),%edx
    negl %edx
    je 1f
    movl %edx,EAX(%esp)
    orl $(CF_MASK),EFLAGS(%esp) # set carry to indicate error
// 调用 syscall_trace 函数1:  call _syscall_trace

可以看到在系统调用的前后都有一个 syscall_trace 的逻辑,所以在系统调用前和后,我们都可以做点事情。来看看这个函数做了什么。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
asmlinkage void syscall_trace(void){
    // 暂停子进程,通知父进程,并调度其他进程执行
    current->exit_code = SIGTRAP;
    current->state = TASK_STOPPED;
    notify_parent(current);
    schedule();}

这里的逻辑就是把逻辑切换到主进程中,然后主进程就可以通过命令获取被调试进程的系统调用信息。下面是一个追踪进程所有系统调用的例子。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
/*
  use ptrace to find all system call that call by certain process
*/#include <sys/ptrace.h>#include <unistd.h>#include <stdlib.h>#include <sys/wait.h>#include <stdio.h>#include <sys/reg.h>
int main(int argc, char *argv[]) {    pid_t pid = fork();
    if (pid < 0) {
        printf("fork failed");
        exit(-1);
    } else if (pid == 0) {
        // set state of child process to PTRACE
        ptrace(PTRACE_TRACEME,0,NULL,NULL);
        // child will change to stopped state when in execve call, then send the signal to parent
        execve(argv[1], NULL, NULL);
    } else {
        int status;
        int bit = 1;
        long num;
        long ret;
        // wait for child
        wait(&status);
        if(WIFEXITED(status))
            return 0;
        // this is for execve call which will not return, and for os of 64-it => ORIG_RAX * 8 or os of 32-it => ORIG_EAX * 4
        num = ptrace(PTRACE_PEEKUSER, pid, ORIG_RAX * 8, NULL);
        printf("system call num = %ld\n", num);
        ptrace(PTRACE_SYSCALL, pid, NULL, NULL);
        while(1) {
            wait(&status);
            if(WIFEXITED(status))
                return 0;
            // for enter system call
            if(bit) {
                num = ptrace(PTRACE_PEEKUSER, pid, ORIG_RAX * 8, NULL);
                printf("system call num = %ld", num);
                bit = 0;
            } else { // for return of system call
                ret = ptrace(PTRACE_PEEKUSER, pid, RAX*8, NULL);
                printf("system call return = %ld \n", ret);
                bit = 1;
            }
            // let this child process continue to run until call next system call
            ptrace(PTRACE_SYSCALL,pid,NULL,NULL);
        }
    }}

总结

ptrace 功能复杂而强大,理解它的原理对理解其他技术和工具都非常有意义,本文大概做了一个介绍,有兴趣的同学可以自行查看源码。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-12-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 编程杂技 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
优秀学员笔记:转录组课堂笔记Day1~2
双端测序:一般一个样本对应两个fq文件,gz是压缩后缀,如SRR1039510对应
生信技能树
2025/04/30
770
优秀学员笔记:转录组课堂笔记Day1~2
RNA-seq 详细教程:分析准备(3)
在过去的十年中,RNA-seq 已成为转录组差异表达基因和 mRNA 可变剪切分析不可或缺的技术。正确识别哪些基因或转录本在特定条件下的表达情况,是理解生物反应过程的关键。
数据科学工厂
2023/02/27
1.1K0
RNA-seq 详细教程:分析准备(3)
RNA-seq 详细教程:分析流程介绍(1)
进行差异表达基因分析的前提是,获取代表基因表达水平的矩阵。因此在进行分析前,必须知道基因表达矩阵是如何产生的。
数据科学工厂
2023/02/27
3.2K0
RNA-seq 详细教程:分析流程介绍(1)
看第一眼以为是错误的转录组测序数据分析
今天要介绍的是2022发表的文章:《Inhibition of integrin αvβ6 sparks T-cell antitumor response and enhances immune c
生信技能树
2023/09/04
1910
看第一眼以为是错误的转录组测序数据分析
一篇文章学会miRNA-seq分析
第一讲:文献选择与解读 前阵子逛BioStar论坛的时候看到了一个关于miRNA分析的问题,提问者从NCBI的SRA中下载文献提供的原始数据,然后处理的时候出现了问题。我看到他列出的数据来自iron torrent测序仪,而且我以前也没有做过miRNA-seq的数据分析, 就自学了一下。因为我有RNA-seq的基础,所以理解学习起来比较简单。 在这里记录自己的学习过程,希望对需要的朋友有帮助。 这里选择的文章是2014年发表的,作者用ET-1刺激human iPSCs (hiPSC-CMs) 细胞前后,观察
生信技能树
2018/03/08
16.1K0
一篇文章学会miRNA-seq分析
宏转录组学习笔记(二)
继续前面的学习,前面已经把软件安装完成,数据库准备好,下面就是分析的过程了,基本上按照原文的命令进行的,由于教程中没有给出tara_f135_full_megahit.fasta这个文件,这里我们就把这几个样本的组装提到了前面,自己组装获得这个序列,然后再进行物种注释。
用户1075469
2020/03/31
1.6K0
宏转录组学习笔记(二)
Salmon:快速准确的转录本定量工具
在转录组分析中,转录本定量 是关键的一步。我们需要准确计算不同基因或转录本的表达水平,以便进行差异表达分析等下游研究。Salmon 是一款专门用于转录本定量的高效工具,它通过伪比对(quasi-mapping)技术,极大提高了处理速度,同时保持了高准确性。
简说基因
2024/12/23
1760
Salmon:快速准确的转录本定量工具
RNA-seq 详细教程:分析准备(3)
在过去的十年中,RNA-seq 已成为转录组差异表达基因和 mRNA 可变剪切分析不可或缺的技术。正确识别哪些基因或转录本在特定条件下的表达情况,是理解生物反应过程的关键。
数据科学工厂
2023/01/29
1.1K0
看优秀本科生如何一周内学会Linux进而搞定RNA-seq上游分析
我是武汉大学基础医学专业第一届的学生,2016年9月刚进大学的时候就选了导师进入实验室接受科研训练。虽然我们实验室不是专门做生物信息学的,但第一次和导师正式交流的时候,她就建议我要学点生信。(巧合的是2016年9月也是生信菜鸟团转型生信技能树的时间点,如果所有的导师都如此明智就好了)
生信技能树
2020/04/14
8.8K1
看优秀本科生如何一周内学会Linux进而搞定RNA-seq上游分析
RNA-Seq数据分析上下游打通
数据集为GSE149638, 2x101 bp paired-end RNA-seq,Illumina HiSeq 2500 with poly-A selection。源于健康人的M0和M1 macrophages。原始数据M0和M1各有48个重复。全部使用还是需要耗费一定时间和计算资源的,这里就各挑选3个重复进行练习。
生信技能树
2021/07/29
3K0
作者仅提供了fpkm格式表达量矩阵的转录组测序数据集该如何重新分析呢
研究者们在GEO数据库是有数据分享:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE182923
生信技能树
2024/06/08
3800
作者仅提供了fpkm格式表达量矩阵的转录组测序数据集该如何重新分析呢
转录组—上游分析_如何拿到count矩阵
本文档记录GSE149638数据集中下载SRR11652578和SRR11652615原始数据
sheldor没耳朵
2024/08/12
4161
转录组—上游分析_如何拿到count矩阵
转录组测序数据的高级分析,比如可变剪切,融合基因,lncRNA组装
如果是6~16个转录组样品的测序的fastq数据,需要走转录组高级分析,比如可变剪切,融合基因,de novo的lncRNA组装,我们仅仅是收取一个计算机资源的费用,800到1600元人民币即可,并且提供全套代码。不管是公共数据集还是你自己的实验测序数据,一样的费用!我们会代替你跑如下所示的流程:
生信技能树
2021/10/21
2.6K0
转录组测序数据的高级分析,比如可变剪切,融合基因,lncRNA组装
测序数据回来了该怎么办?
相信大家在研究生涯或多或少都会接触到生物信息,以为这是一块很神秘很高深的领域,其实并不难,只要你去看去学去实践,一切都有可能。 本篇主要告诉大家,如果手里有转录组测序的raw data,该怎么做上游分析,下游当然是可以交给我们的R软件去做啦。 1.数据准备 1.1测序数据(reads) 已有fastq文件,ILLUMINA公司的,具体可以查看你手头的测序报告,或一开始的实验设计。 1.2目标物种基因组数据【基因组fa (genome.fa)和注释文件 (gtf/gff3)】 这一步可以从ENSEMBL下载。资源汇总地址:http://ftp.ensembl.org/pub/可以选择最新的 104版本(截止2021/11/1)。
生信喵实验柴
2021/12/15
1.8K0
测序数据回来了该怎么办?
数据分析:基于STAR+FeatureCounts的RNA-seq分析全流程流程
分析流程涉及到众多的软件以及R包等,为了更方便配置该环境,建议使用anaconda软件安装。anaconda是包管理工具,可以将软件作为其包进行安装管理,并且可以设置多个环境,方便不同依赖环境的软件在同一台机器安装。安装anaconda方法见网上教程。
生信学习者
2024/07/05
5850
limma/voom,edgeR,DESeq2分析注意事项,差异分析表达矩阵与分组信息
给粉丝朋友们带来了很多理解上的挑战,所以我们开辟专栏慢慢介绍其中的一些概念性的问题,上一期: 箱线图的生物学含义
生信技能树
2019/08/22
14.1K0
CUT&Tag 数据处理和分析教程(1)
在真核细胞的核里,DNA 上发生的所有动态活动,比如基因表达调控,都离不开一个由核小体(包括它们的化学修饰)、转录因子和相关蛋白复合物组成的染色质环境。不同的染色质特征会标记出激活或抑制基因表达的调控区域,以及那些在细胞类型间有差异、在发育过程中会变化的染色质区域。
数据科学工厂
2025/02/27
1910
CUT&Tag 数据处理和分析教程(1)
一个优秀的ATAC-seq数据分析资源实战(一)
之前我们给大家介绍了两篇ATAC-Seq数据分析pipeline的优秀综述:综述:ATAC-Seq 数据分析工具大全 和 Omni-ATAC:更新和优化的ATAC-seq协议(NatProtoc),我们今天就来实战介绍!
生信技能树
2025/02/27
1440
一个优秀的ATAC-seq数据分析资源实战(一)
RNA-seq 详细教程:分析流程介绍(1)
进行差异表达基因分析的前提是,获取代表基因表达水平的矩阵。因此在进行分析前,必须知道基因表达矩阵是如何产生的。
数据科学工厂
2023/01/29
1.7K0
一个RNA-seq数据分析的Snakemake流程
但是如果RNA-seq数据分析项目非常多,或者说每个项目里面的样品非常多, 这个时候我们会推荐流程化管理我们的脚本,我个人的数据分析生涯主要是shell脚本,因为并不是企业级项目管理,能跑十几个项目还是因为要去给粉丝帮忙。对企业生产实践来说,Snakemake流程化管理各个NGS数据分析流程是一个很好的选择,恰好看到了一个最新的 Snakemake workflow, 推荐给大家。
生信技能树
2021/12/17
1.2K0
一个RNA-seq数据分析的Snakemake流程
推荐阅读
相关推荐
优秀学员笔记:转录组课堂笔记Day1~2
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验