不可靠的网络问题分类
在前面我们讲述了分布式系统模型,其中已经对响应结果做出了分析,这里我借助《设计数据密集系统》一张图来说明下, 总结起来主要有三个方面:
请求/响应丢失: 数据包可能因物理链路故障(...那么将上述的例子映射到我们同步网络环境中,同步网络是双向的,即双轨,广州到北京以及北京广州的轨道.从网络拓扑结构中可以看出,每个电路都是提前预留对应传输数据的大小,并且由于不存在排队现象,网络延迟从端到端是固定的...节点失效的模糊性主要是体现在分布式系统中针对Fault Tolerance中节点故障自动检测切换过程,主要分为两类,一是计算集群故障检测; 二是存储集群故障检测....但是在上述故障检测过程中, 由于网络的存在, 我们必须要考虑到实际不可预测的因素, 比如上述的两者模型中Node3节点/Master节点真的是故障还是由于网络问题而被判断为故障呢?...可能会想到一个可行的解决方案, 那么就是在上述故障检测中增加超时机制, 如果超过指定的时间我们再进行重试, 若无响应则我们判断为对应的节点故障, 然后再采取故障容错机制或者重新选举新Master节点方式来避免分布式系统产生更多连锁的