前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >同城异地灾备

同城异地灾备

作者头像
SRE运维实践
发布2019-07-08 13:17:13
4.1K0
发布2019-07-08 13:17:13
举报
文章被收录于专栏:SRE运维实践

序言

同城异地灾备,主要是用来进行备份容灾的,从而当一个数据中心挂了,另外一个数据中心经过切换之后,能让服务迅速的恢复。

同城双活,则是基于多机房的情况下,流量经过双机房,一个机房挂掉,完全不影响业务。

微风浮起,吹动星空一缕轻云

很正经的吹牛逼

从网络的层面来说,单个机房的存在是一个单点故障,因为一个机房宕机,那么业务立刻中断,从而无法进行升级。

云服务,最重要的就是可扩展性,而什么版本支持扩展。。。从集群的角度来进行扩展。。。

从最开始,业务不断的发展,各种流量拥上来,导致业务的吞吐量的剧增,从而促使底层的技术要不断的进行扩展,从而云平台的版本是否支持,必须要进行升级。。。

随着业务的进一步发展,需要提供高可用水平,从而需要从单机房扩展为多机房,从而也就有了同城容灾。。。

对于运维来说,多一次升级,多一次变更,就会多一个故障,多一个锅。。。大家排排坐,每个人分一点。。。热升级了解一下,不可预知的中断了解一下

同城异地最关键的点在于存储,存储如何跨机房使用,从而分为几个方面进行探讨:

1、 DNS解析

在业务大量使用DNS解耦的时候,而且使用双机房的时候,那么就必然需要DNS具有一定的智能化,从而就有anycast类型的DNS,所谓的anycast类型的DNS,也就是能返回客户端最短路径的IP地址,从而让用户使用更少的时间得到需要访问的IP地址。

换一种解释的方法就是,anycast类型的DNS就是一种网络寻址和路由的方法,其中来自单个发送方的报文被路由到拓扑中最近的节点之上。

使用anycast类型的DNS,能大大的增强可靠性,可用性,整体提高服务的SLA的水平。

在DNS解析的时候修改的时候,一般是依赖于高可用的SLB服务,从而在切换的时候,一般是对DNS进行动态的修改。

2、 数据库同步

在数据库方面,主要是使用mysql,而mysql则主要是使用主备模式,从而主的在一个机房,而备库则在另外一个机房,在同步的时候,不可避免的情况就是如果一旦主机宕机,从而有可能是丢失数据的,因为mysql在数据同步的时候,是使用异步的方式进行,但是这种由于有操作日志的存在,从而数据也不会丢失,但是,有可能存在冲突的可能,从而需要有人为的介入进行修复。

主备复制的延迟考虑,一般主机房和备机房之间使用万兆网络,从而对于一般的数据传输来说,延迟不是很高,基本上是可以忽略的。

在使用redis的时候,由于目前版本使用的redis2.8版本,从而不能跨机房做成集群的模式,从而导致redis也只能做成主备的模式,而redis作为高性能的缓存,丢失数据就无所谓了,主要还是在于高可用性即可,况且业务可以在降级的情况下使用,从而无须担心。当使用redis3.0或者以上的版本的时候,可以直接跨机房使用redis的集群功能,性能和单机房的速度差不多。

核心数据库,要想高可用,并且不存在数据丢失,从而可以使用分布式数据库,在数据写入的时候,采用强同步的方式写入数据,对于master节点,可以采用三机房三中心的模式,使用paxos算法进行选主,从而达到高可用的目标,并且在数据写入的时候,写入三个分片,从而一个分片的数据损坏,在后台进程中,数据能慢慢的自动弥补回来,从而达到强一致性的数据保存的效果。

在数据库跨机房同步的时候,mysql可能出现脑裂的情况,也就是双机房互联网络出现中断,从而备机房检测到主机房不可用,但是在这个时候,是不能自动进行切换的,需要人工介入处理操作。

3、 SLB高可用

在每个机房中,流量的入口总是SLB,从而保证SLB高可用也是相当关键的,所有的VM的rs服务器都是挂接在SLB之后,一旦SLB不可用,那么所有的业务中断。。。SLB故障了解一下。。。劳资内心慌的一B。。。

要保证SLB的高可用,好像是主要靠交换机来进行保证,使用什么OSPF动态路由协议,从而保证每个SLB的流量都是分摊的,并且SLB之间可以进行会话同步,从而无论是长连接或者是短连接都不会出现太大的问题,业务报错。。。那是必然的。

在使用SLB的时候,可以使用分层的方式来做,第一层使用LVS进行四层负载均衡,第二层使用haproxy做成七层负载均衡,也可以再加上一层,使用nginx来进行证书的解析,也就是专门用来解析https的请求,穿透到后端全部是http的请求,从而保证证书都是放在同一个位置进行解析。

4、 业务高可用

所有以上的目标,其实都是为了业务的高可用,那么再进行保证业务高可用的时候,因为使用的都是VM,从而在创建的时候,需要同步在备用机房创建VM,并且在发布程序的时候,需要同步进行发布,也就是主机房发布一套程序,而备用机房也发布一套程序,资源浪费,当然,这种单纯为了计算而生的VM,其实可以进行负载均衡,或者灰度发布,或者蓝绿测试也不错。

5.、网络

网络分为两种,一种是虚拟网络vpc,一种则是经典网络,也就是物理机所在的网络。。。

其实在创建VM的时候,就可以分配一个虚拟ip,一个是经典ip,从而都可以进行访问,而且也能起到隔离的作用。。。

疯言疯语

快速迭代,快速变化,快速适应。。。

无论是业务的发展,还是人的发展,感觉在更多的时候,技术都不是问题,而发展到最后一切都是人的问题。。。到底是人还是狗,WTF。。。

快速的迭代的时候,其实最主要的就是心态。。。。稳住,不要浪。。。稳住,怎么可能。。。我们的宗旨是要浪的天际。。。

一旦大招开启,怎么可能停的下来。。。完全停不下来,毋宁死。。。向死而生。。。如果撤退了,死的更惨,死的更凄凉,所以。。。不能退

其实最可怕的不是事多,最可怕的是定位不准,最可怕的是职责不清晰。。。最可怕的该上的时候不上,不该上的时候死命的冲。。。。葫芦娃救爷爷,一个个送,最后。。。一个个怂。。。

战事在不断的发展,如果你们都是优秀的,那么就不存在问题了。。。确认过眼神,都不是对的人。。。

识别问题,解决问题。。。将问题抹杀在萌芽之中。。。怎么可能,临时解决的问题那么多,所谓的根源。。。不可能的。。。WTF

突然意识到面试的重要性。。。面试太简单,说明未来的同事都是渣渣。。。面试越难,说明未来的同事的战斗力越来越强。。。从面试看待整体的战斗力了解一下。。。

对一个人,要求越高,从而期望也越大。。。如果对你没有要求,你就是一滩烂泥,关我屁事。。。WTF

从战略上的把控。。。退到全力辅助。。。再退到做好自己的本份。。。还能退到哪里?。。。我是谁,我在哪里,我在做什么。。。

全军出击,还是全军溃败?并不是很懂,或许也懂。。。能观望到未来的发展,并没有一丝曙光。。。说好的蓝天白云呢???

调和一下糟糕的心态。。。所以只能说,你们都很棒,你们都很优秀

内耗消费的精力太多,导致都不能好好输出了。。。大招还在CD之中。。。内忧外患了解一下。。。

where is your focus?what is your attention?I lost my mind。。。。WTF

what is the best solution?talk each other?maybe。。。

关注力可以放开一点点,全神贯注太让人疲倦。。。总是纠结在一些小事当中。。。偶尔或许也需要一点心灵鸡汤。。。毒鸡汤了解一下。。。

关注什么?关注你的目标。。。最终的旅途。。。how to insist。。。没必要为了一个项目搭上了所有的时间,所有的精神,所有的关注力,所有的价值观。。。not worth of it。。。need some flow,fly my mind。。。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-09-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 SRE运维实践 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档