目录
1、前言 · 浅析IO模型
2、图解BIO之传统编程模型
3、基于I/O复用模型的Reactor模式
4、Reactor模式的多样变化
大家好,我叫圆满,大家都叫我小满。中间件的世界很精彩,我接受召唤,去探寻在中间件世界中的大放异彩的王者秘境-Netty,netty的线程模型采用了Reactor模式,今天我们就开篇谈一谈网络IO编程的一些小事,还有Reactor模式的解读。
1、前言 · 浅析IO模型
IO操作,包括网络IO,文件IO。本文讨论的是网络编程中的概念。IO模型的话,很多大佬都做过深入分析,一般分为5种模型。我们这边也不去从LInux系统底层去深度剖析,从下面的IO模型对比图,可以理解区别一下 同步阻塞 这四字中同步和阻塞各自的含义。
如图中所示,其实我们操作IO一般就是分为俩个过程,等待数据就绪,拷贝数据从内核复制到用户空间。前四种模型都是阻塞的,并且第二阶段都是阻塞的。我们可以从下面的概念来理解一下同步、阻塞的概念。
阻塞调用与非阻塞调用,阻塞调用,调用结果返回之前,当前线程会被挂起,一直等待,直到结果返回;非阻塞调用则不用等调用结果返回,不会阻塞当前线程,可以去干其他事情。
同步处理和异步处理,同步处理是指,被调用方得到最终结果之后返回给调用方;异步处理是指,被调用方不等处理结束先返回响应,再进行计算,当计算完成时,通知调用方并将结果返回给调用方。
02
图解BIO之传统编程模型
BIO,BLockingIO,同步阻塞模式。当我们调用类似accept(),read(),connect()等API操作时,系统调用会卡住。例如,我们调用read()方法从socket中去读取数据,但是其实我们无法预知对方数据是否发送,只能是一直等待或者网络超时。这是我们传统的阻塞式网络编程,一个线程被挂起,望眼欲穿,什么事情也干不了,干等着。
想想看,要是有个几千几万的连接过来,那么我们得启动对应数量的线程大军,全都hang住,这对操作系统来说是灾难性的。线程越多,Context Switch操作越多,这会消耗大量CPU。并且每一个线程都会使用一定大小的栈,要是有成千上万的线程,那么内存消耗也是很吓人的,虽然可以通过大内存撑起了上万并发,那百万,千万呢?不过系统稳定性和成本都会指数爆炸。
也有人提出使用线程池去优化,避免产生大量的线程,但是这样做同时也限制了连接数量,这肯定不是最优解,如果是一个对外的TCP服务,网络连接数量是不可预估的。
03
基于I/O复用模型的Reactor模式
当~当~当~,NIO就要闪亮登场,NON-Blocking,同步非阻塞模式,和BIO的区别是什么呢?我们同样进行read操作,BIO一个客户端连接对应一条处理线程,在没有数据过来的时候,read操作就会一直卡在那里;NIO不是这样子的,一旦调用read()操作就会马上返回,没有数据就会返回-1,有数据就返回读取的字节数。
一般我们会采用I/O多路复用的模型,多个连接共用一个对象,应用程序只需要在一个对象上阻塞住,无需阻塞等待所有的连接。当某条连接有新的数据可以处理的时候,就由系统通知应用程序,阻塞的线程就会唤醒,准备进行业务处理。
这时候不会采用BIO中那种一个连接对应一个线程的方式,我们采用线程池,复用线程资源,将连接完成的业务处理任务分发给线程池中的线程进行处理,一个线程可以处理很多连接的业务。
基于线程池+I/O复用模型,这就是Reactor模式基本设计思想。
Reactor模式,通过一个或者多个输入同时传递给服务端请求的事件驱动处理模式。服务端处理多路请求,将请求分发给请求对应的处理线程。I/O多路复用统一监听多个事件,当接收到事件的时候分发给处理线程。
04
Reactor模式的多样变化
Reactor模式最基本的俩个组件:
根据Reactor的数量和处理资源线程池的数量不同我们可以有以下三种变化:
最后,我们可以总结一下,Reactor模式具有如下的优点: