最近公司在搞异地多活,特来写篇文章来学习和回顾一下。
异地多活看字面意思 :不通的地方部署服务。前段时间发生的B站挂掉的事情,网上众说纷纭,有的说是有机房着火了,导致服务宕机。那对于这种突发的情况,我们应该如何应对呢?包括说有些地方地震了导致机房宕机等等。
这些自然灾害我们是不可避免的所以我们得从架构层面解决这种突发问题。
在背景也讲了我们公司也做了异地多活,多活的方式数据跨城异区。一个集群部署在广州南沙,一个部署在广东佛山。
由于我们的服务系统复杂度不高,主要就是读,所以在架构复杂度上也是不高的,还是比较容易搞的。
我们服务的流量高峰QPS大概在在十万级别,性能得在200ms内,一般都是10ms内返回。
大概服务的物理架构图如下:
从上面架构图可知:
https://time.geekbang.org/column/article/9787
https://zhuanlan.zhihu.com/p/32009822