一、平滑升级步骤
1、重命名之前的sbin/nginx文件,将新的nginx文件放到sbin/目录下
#mv ./sbin/nginx ./sbin/nginx.old
#cp ~/nginx ./sbin/
2、向正在运行的nginx发送USR2信号启动新的nginx,这个时候新老nginx都会接收请求,看那一个进程能抢到锁,抢到锁的worker进程可以accpet新请求
#kill -USR2 `cat nginx.pid`
3、观察新的nginx运行无误后,向旧nginx发信号 停止旧nginx的运行
#kill -QUIT `cat nginx.pid.oldbin`
二、源码分析
1,nginx启动时 设置信号监听函数,监听信号
src/core/nginx.c
368行 ngx_init_signals函数 设置要监听的信号,和信号的处理函数
src/core/nginx.c
291-293行 信号为sig->signo,对应的处理函数为sig->handler
sig的定义如下
QUIT和USR2的信号处理函数都为 ngx_signal_handler
对应的流程图为
2、master进程通过sigsuspend挂起在信号监听处
3,向master进程id发送USR2信号
ngx_signal_handler处理USR2信号
src/os/unix/ngx_process.c
372行 设置了ngx_change_binary=1
master进程接收到信号,从挂起状态恢复,继续执行
src/os/unix/ngx_process.c
277行 ngx_exec_new_binary通过fork启动新的nginx bin文件
src/core/nginx.c
589行 ngx_set_evviroment 设置新nginx bin的环境变量
640行 ngx_rename_file 通过rename函数将nginx.pid文件重命名为nginx.pid.oldbin
651行 ngx_execute 启动新的bin文件
由于nginx老master进程fork出的新nginxmaster进程,他们可以监听同一个端口,所以新nginx和老nginx可以同时监听端口,具体谁执行看哪一个worker子进程抢到了锁,可以accpet新连接
src/os/unix/ngx_process.c
src/os/unix/ngx_process.c
src/os/unix/ngx_process.c
对应的流程图如下
4、向老的nginx进程发送QUIT信号,从容关闭
master进程收到QUIT信号后,将ngx_quit置为1
master进程接收到信号,从挂起状态恢复,继续执行
209行 ngx_signal_worket_processes 向worker进程发送 NGX_SHUTDOWN_SIGNAL(QUIT)信号
215行 ngx_close_socket 主进程关闭监听的socket
src/os/unix/ngx_process_cycle.c
504行 通过kill函数向所有worker进程发送信号
5、worker进程收到NGX_SHUTDOWN_SIGNAL(QUIT)信号
src/os/unix/ngx_process.c
360行 worker进程将ngx_quit置为1
worker进程收到信号后从epoll_wait中唤醒从ngx_process_events_and_timers函数中恢复,
710-714行 发现ngx_quit=1后将ngx_quit恢复为0,ngx_exiting置为1,
713行 通过ngx_close_listening_sockets关闭处理的socket
609行 下一次循环发现ngx_exiting=1后,处理队列中的已有事件和超时事件,发现没有要处理的事件了,就通过ngx_worker_process_exit退出worker进程
src/os/unix/ngx_process_cycle.c
1024行 调用各个模块的exit_process方法
1067行 销毁内存池
对应的流程图如下
6、子进程退出后,作为父进程的master进程会收到SIGCHLD信号
src/os/unix/ngx_process.c
387行 父进程收到SIGCHLD后将ngx_reap置为1,
437行 发现信号是SIGCHLD后执行ngx_process_get_status函数判断worker子进程是正常退出,还是异常退出
src/os/unix/ngx_process.c
494-499行 如果发现worker子进程如果是正常退出的,会将exited置为1
master进程接收到信号,从挂起状态恢复,继续执行
176行 发现ngx_reap=1后,ngx_reap_children函数判断是否需要重启worker进程
如果worker是因为收到了quit信号正常退出的,所有worker进程退出时,live=0
183行 live=0 并且收到了ngx_quit信号 通过ngx_master_process_exit关闭master进程
src/os/unix/ngx_process_cycle.c
619 如果worker至今才是因为意外退出的,并且可以重启,则调用ngx_spawn_process重新启动一个worker子进程
642 如果有worker进程还在运行则live=1 如果全部的worker子进程都已经退出则live=0
src/os/unix/ngx_process_cycle.c
656行 ngx_delete_pidfile 删除pid文件
666行 ngx_close_listening_sockets 关闭监听端口
685行 销毁内存池
686行 退出
对应的流程图如下