摘要:什么是分布式 CAP 原理,什么是分区容错性,zookeeper 和 eureka 的 CAP 区别是什么,还有作为公司的架构师你们是怎么做的,那些分布式系统设计成了 CP、AP,为什么这样设计等等一系列问题。
C(Consistency)
:一致性,即数据一致性,特指分布式系统中的数据一致性。A(Availability)
:可用性,即服务的高可用,特指分布式系统中服务的高可用,某个服务瘫痪不影响整个分布式系统的正常运行。P(Partition Tolerance)
:分区容错性(也有的叫分区耐受性),即网络故障,特指分布式系统中服务之间出现了网络故障,整个分布式系统仍然保持可用性和一致性。
一句话概括 CAP
:在分布式系统中,网络故障,服务瘫痪,整个系统的数据仍然保持一致性。
上面的表述可能不容易理解,举一个通俗的例子讲讲什么是分布式 CAP 原理。
如上图所示,小张在京东商城准备购买几本微服务实战相关的书籍,订单总金额共 200 元,他刚好有一张满 200 减 100 元的优惠劵。
这时分 3 种情况说明分布式系统的 CAP 如下:
数据一致性体现
:系统可用性体现
:系统分区容错性体现
:CAP 定理中最难理解的概念是 P,分区容错性,画个图大家就理解了。
在断网的情况下,2 台服务器变成了独立网络,彼此无法通信,这个情况就是分区。在分区的情况下,分布式系统如果要保证数据一致性和可用性的话,那就满足分区容错性了。
目前大部分互联网企业都是微服务架构,即分布式系统。 现在某电商微服务架构,假设出现网络故障(P),服务挂掉(A),整个系统的数据仍然保持一致。这是无法做到的。
相对可以实现的方案: 业界的做法是 CAP 三选其二,即
CP
AP
CA
(请思考?后面叙述)
当服务之间出现网络故障的情况下:
问题:
分布式系统的解决方案:
CAP 牺牲一致性(AP)
:保证高可用,即保证订单服务可以正常访问,保证 PLUS 会员服务可以正常访问,牺牲了数据的一致性。
小张去京东商城下订单(但是没有扣除 100 元优惠劵),这种情况下,小张订单提交成功后,再去查看 100 元优惠劵还在,居然没有扣除成功,但是实付金额是 100 元,很纳闷(心里窃喜)。CAP 牺牲可用性(CP)
:保证数据一致性。
当小张去京东商城下单时,提示:“网络异常,请稍后再试”。CAP 牺牲分区容错性(CA)
:不要P分区,即不允许出现网络故障,这是不可能实现的。
所以在分布式系统中,是不存在 CA 的。即使传统单体系统也做不到CA,因为单体系统也会出现单一故障。
通过小张在京东商城下订单的案例,小伙伴应该都弄明白了吧。
1)图解 zookeeper 的 CAP 原理 注:此处不介绍 zookeeper 底层原理和实现 zookeeper 作为微服务注册中心是 CP 原理,即保证了数据的一致性,牺牲了可用性。如下图所示:
2)图解 Eureka 的 CAP 原理 如下图所示:
通过以上的案例描述和图形解读,相信大家对于微服务(分布式系统)架构中 CAP 原理有了一定的了解。比如知道了什么是 CAP 原理,什么是分区容错性,zookeeper 和 eureka 作为注册中心的 CAP 区别是什么。同时希望对今后你们公司的系统架构设计有所帮助,系统设计是遵循 CP 还是 AP。