一、什么是进程
从用户的角度来看进程是程序的一次执行过程。 从操作系统的核心来看,进程是操作系统分配的内存、CPU时间片等资源的基本单位。 进程是资源分配的最小单位。 每一个进程都有自己独立的地址空间与执行状态。 像UNIX这样的多任务操作系统能够让许多程序同时运行,每一个运行着的程序就构成了一个进程。
二、进程数据结构
进程的静态描述:由三部分组成:PCB、有关程序段和该程序段对其进行操作的数据结构集。 进程控制块:用于描述进程情况及控制进程运行所需的全部信息。 代码段:是进程中能被进程调度程序在CPU上执行的程序代码段。 数据段:一个进程的数据段,可以是进程对应的程序加工处理的原始数据,也可以是程序执行后产生的中间或最终数据
堆栈段:程序运行时需要在这里做数据运算,存储临时数据,开辟函数栈等。在Linux下,栈是高地址往低地址增长的。
三、进程与程序
进程是动态的,程序是静态的。 进程的生命周期是相对短暂的,而程序是永久的。 进程数据结构PCB。 一个进程只能对应一个程序,一个程序可以对应多个进程。
四、进程状态变迁
运行状态(TASK_RUNNING) 可中断睡眠状态(TASK_INTERRUPTIBLE) 不可中断睡眠状态(TASK_UNINTERRUPTIBLE) 暂停状态(TASK_STOPPED) 僵死状态(TASK_ZOMBIE)
In computer operating systems terminology, a sleeping process can either be interruptible (woken via signals) or uninterruptible (woken explicitly). An uninterruptible sleep state is a sleep state that cannot handle a signal (such as waiting for disk or network IO (input/output)). When the process is sleeping uninterruptibly, the signal will be noticed when the process returns from the system call or trap. A process which ends up in “D” state for any measurable length of time is trapped in the midst of a system call (usually an I/O operation on a device — thus the initial in the ps output). Such a process cannot be killed — it would risk leaving the kernel in an inconsistent state, leading to a panic. In general you can consider this to be a bug in the device driver that the process is accessing.
五、进程控制块
进程描述信息
进程标识符用于唯一的标识一个进程。
进程控制信息
进程当前状态 进程优先级 程序开始地址 各种计时信息 通信信息
资源信息
占用内存大小及管理用数据结构指针 交换区相关信息 I/O设备号、缓冲、设备相关的数结构 文件系统相关指针
现场保护信息
寄存器 PC 程序状态字PSW 栈指针
六、进程标识
每个进程都会分配到一个独一无二的数字编号,我们称之为“进程标识”(process identifier),或者就直接叫它PID. 是一个正整数,取值范围从2到32768(2.6内核以下) 当一个进程被启动时,它会顺序挑选下一个未使用的编号数字做为自己的PID 数字1一般为特殊进程init保留的
七、进程的创建
不同的操作系统所提供的进程创建原语的名称和格式不尽相同,但执行创建进程原语后,操作系统所做的工作却大致相同,都包括以下几点: 给新创建的进程分配一个内部标识,在内核中建立进程结构。 复制父进程的环境 为进程分配资源, 包括进程映像所需要的所有元素(程序、数据、用户栈等), 复制父进程地址空间的内容到该进程地址空间中。 置该进程的状态为就绪,插入就绪队列。
八、进程的销毁
进程终止时操作系统做以下工作: 关闭软中断:因为进程即将终止而不再处理任何信号; 回收资源:释放进程分配的所有资源,如关闭所有已打开文件,释放进程相应的数据结构等; 写记帐信息:将进程在运行过程中所产生的记帐数据(其中包括进程运行时的各种统计信息)记录到一个全局记帐文件中; 置该进程为僵死状态:向父进程发送子进程死的信号(SIGCHLD),将终止信息status送到指定的存储单元中; 转进程调度:因为此时CPU已经被释放,需要由进程调度进行CPU再分配。
九、对于一个进程来说,相关联的ID有下面几个:
ID | 作用 |
---|---|
实际用户ID | 实际上我们是谁 |
实际组ID | |
有效用户ID | 以什么权限运行 |
有效组ID | |
保存的设置用户ID | 由exec函数保存 |
保存的设置组ID |
#include <unistd.h>
int setuid(uid_t uid);
int setgid(gid_t gid);
//r for real,e for effective
int setreuid(uid_t ruid,uid_t euid);
int setregid(gid_t rgid,gid_t egid);
int seteuid(uid_t uid);
int setegid(gid_t gid);
关于保存的设置ID判断条件是_POSIX_SAVED_IDS/_SC_SAVED_IDS.
通常来说有效uid和gid等同于实际uid和gid. 但是对于一些特殊程序比如需要修改passwd,那么程序执行时必须以另外一种用户权限启动,所以区分了这两个概念。比如我们调用passwd修改密码,ruid和rgid是我们自己,而euid和egid则是root(/etc/passwd属主是root).为了查看文件是否设置了SUID和SGID,我们可以使用S_ISUID和S_ISGID & st_mode。
这里有必要说说保存设置用户ID的作用(保存设置组ID同)。假设我们编写一个程序aaa, 运行者是simba, 然后aaa的owner是root并且设置了SUID特殊权限位。 当我们exec这个aaa程序的话,我们ruid=simba, euid=root. 那么如果进行 seteuid(simba) 操作的话, 修改有效用户id为simba是允许的,因为ruid就是simba. 这样ruid=simba,euid=simba. 这样就造成了一个问题,如果我们此时想seteuid(root), 系统如何验证呢? 系统不可能再去读取一次文件系统,所以要求内核本身就保存一个设置用户id.可以知道设置用户id 通常保存的内容就是第一次exec文件使用的euid.
对于setuid(uid)行为是这样的:
id | exec但是SUID关闭 | exec而且SUID打开 | 超级用户进程调用setuid(uid) | 非特权用户调用setuid(uid) |
---|---|---|---|---|
ruid | 不变 | 不变 | uid | 不变 |
euid | 不变 | 文件owner uid | uid | uid |
saved_id | euid | euid | uid | 不变 |
对于setreuid不是很了解,对于seteuid来说和setuid差别不大,只不过超级用户进程调用seteuid(uid)只是修改euid=uid.
十、终止进程的5种方法
从main函数return返回 调用exit(C库函数) 调用_exit(系统调用) 调用abort(产生SIGABRT信号,异常终止) 由信号终止(如ctrl+c 产生的 SIGINT信号)
需要注意的是main函数返回会调用exit;exit会调用_exit; exit会调用fflush,但_exit不会调用fflush。
atexit可以注册终止处理程序,ANSI C规定最多可以注册32个终止处理程序。终止处理程序的调用与注册次序相反
int atexit(void (*function)(void));
参考:《APUE》