IDC时代,业务对网络容灾参与较少,主要依赖数据中心网络容灾建设程度;当到了云的时代,云服务商将底层网络能力产品化后,云上客户更多参与网络容灾建设,提升业务稳定性。...本文从云网络概述,云网络容灾复杂度以及典型案例来介绍云网络容灾建设。 1.云网络概述 云网络概述主要分为云服务商基础设施网络架构和云产品两部分,让云上客户更加深入了解云网络,用好云网络。...以腾讯云为例,在同地域选择机房地址的时候,距离大于60公里,要求不同可用区延时小于3ms,来满足云上客户同城容灾建设基本需求。...混合云容灾模式,这里考虑到IDC和云上线路容灾情况,一般建议两条专线接入不同的POP点来进行容灾建设;同时建立VPN或者GRE公网逃生通道来紧急恢复业务。...注意:对于入口VIP写死情况,客户端升级的成本较高。 image.png 3.2 混合云网络容灾 混合云网络容灾分为两个部分: 1)idc和云机房之间线路容灾,主要线路分为专线和VPN。
本文结合云平台公网能力,从网络平台角度来分析容灾建设可行性。...2.公网出口容灾方案 2.1 IDC和云平台出口互为主备 正常情况下,IDC和云平台公网出口流量是烟囱式,互不交叉;当IDC公网出口异常,流量切换到云平台,同样云平台公网出口异常,流量切换到IDC。...云平台NAT网关不支持流量导入,需要企业在VPC自建流量转发系统,推荐流量出口选择直接绑定EIP模式,流量更可控。 整体公网出口容灾方案如下: image.png 2.1.1 云平台切换方案。...2.1.2 IDC容灾切换方案 正常情况下,IDC业务流量通过NAT访问公网,如上路绿色线条标识。...2.2 IDC机房公网出口容灾方案 正常情况下,IDC和云平台公网出口流量是烟囱式,互不交叉;当IDC公网出口异常,流量切换到IDC备用公网出口通道,同样云平台公网出口异常,流量切换到云平台公网出口通道
3.云容灾优势 云容灾是一种基于云平台发展起来的服务模式。...云容灾结合云平台的计算、存储和带宽等诸多优势,相比传统容灾具备了多方面的优势: 基础设施减少 摒弃采购传统的灾备服务器,借助云平台供应商提供的计算和存储平台,或直接采用云容灾DRaaS应用服务。...快速恢复 为即使有传统定制的远程备份,仍然需要时间去做数据的恢复和业务重启,且取决于远程备份的地点远近和远程服务器的性能。而云容灾是可以充分利用云的能力,突破物理限制,在云端做到业务启动。...4.云容灾级别和能力 参考传统容灾的级别划分,由于云容灾的基础设施采用了云平台,在云容灾的级别划分上,应用级和业务级的区别已经不大了,因此在这里将云容灾的容灾级别分为:数据级容灾、业务级容灾。...用户使用Zerto,用户可以得到可靠的,接近实时的服务器复制,而花费仅仅是SAN阵列式复制成本的一小部分。
腾讯云跨地域容灾方案DNSPod+CLB.ppt D监控介绍:https://support.dnspod.cn/Kb/showarticle/tsid/16/ D监控切换规则:https://
“灾“可大可小,某种意义上来讲就是"单点"问题,例如核心业务部署单台服务器上,这台服务器宕机起不来了,对业务来讲就是一场灾难;而“容”,是解决各种"单点"问题。...典型案例 虽然这里对“容灾”概念进行扩展,一般指同地域以及跨地域粒度的容灾;以云上客户案例同时结合腾讯云产品能力,分别对同城容灾,异地灾备以及异地多活进行说明。...以下是云上某个金融公司异地容灾架构: 1)接入层和业务层均使用低配以及业务单台服务器部署方式,主要提升业务快速扩容能力,一方面主可用区异常,借助腾讯弹性伸缩AS能快速扩容,另一方面业务发布版本在不同地域保持一致...2)该数据层使用云上PAAS产品,云上产品均支持异地容灾能力,同时操作便捷。如CDB和COS均通过云上控制台按钮式方式建设异地容灾能力;而对于es通过ccr方式进行数据复制。...以下是云上某saas厂家同城双活案例: 云上的存储业务均采用虚拟机或者黑石机器进行自建,业务以账户单双号进行set化部署;A区的数据库存双号,B区的数据库存双号;数据库同步使用双向方式;每个AZ数据库均存在全量数据
(2)过度关注架构内因对可用性的影响,忽略外部安全问题对可用性影响。 安全容灾解决方案同业务容灾解决方案的区别: (1)业务容灾解决方案倾向业务架构内因解决问题。...业务容灾问题发生的普遍原因是基于业务访问量,架构负载,业务逻辑等内部可用性层面导致,解决思路多以异地灾备,混合云多活灾备, 数据迁移同步等层面解决。 (2)安全容灾解决方案倾向安全行为外因解决问题。...安全容灾问题的普遍原因是基于外部安全攻击行为导致,解决思路多以数据灾备,主机灾备,安全防御,安全检测等思路解决。 安全的根本目的是:保障业务的连续性。 不能片面地为了“安全”而安全。...二.主机安全面对的灾有哪些 1.核心灾难:勒索病毒 (1)数据库被删勒索 image.png (2)数据恶意加密勒索 image.png 2.挖矿木马 (1)服务器可用性问题:高占用CPU进程。...清除内核挖矿木马的代价是:清除病毒同时可能导致服务器宕机。 灾后影响:(1)业务服务崩溃,系统不可用。 (2)消除不净,病毒反复重生,耗散人力。
但是基于混合云部署的业务系统往往复杂性高,维护成本大,因此也为业务稳定性带来了不小的挑战,为保证业务的稳定性,进行有规律的容灾演练是一种科学的方式。...但是在复杂的混合云环境中进行容灾演练本身就比较复杂,涉及的云资源之多,进行混合云容灾演练的门槛高。...混合云容灾的必要性混合云结合了公有云和私有云的特点,因此在多云部署的环境中,负载均衡、数据安全、服务安全稳定以及扩容伸缩等方面都将变得更加复杂。...混沌演练对混合云容灾的价值体现腾讯云混沌提供了对云上资源类型CLB、CVM、专线、数据库等对象类型的故障,通过混沌演练可以了解云服务不可用时的业务表现,检验故障告警的有效性,同时也可以验证脱离公有云后自身私有云架构的容灾表现...如何快速进行混合云容灾混沌演练腾讯云混沌演练工程结合行业经验,生成了一个混合云容灾演练经验模板,可通过该模板快速生成演练:前往腾讯云混沌演练平台【概览】选择「混合云容灾演练」行业经验模版。
数据存储容灾建设主要从数据可靠性和业务稳定性两个维度阐述。这两者有哪些区别呢?...企业通常使用数据存储产品主要为云硬盘(CBS)以及对象存储(CFS)。...1.数据可靠性 1.1 云硬盘(CBS) 云硬盘采用三副本的分布式机制,系统确认数据在三个副本中都完成写入后才会返回写入成功的响应。...1.2 对象存储(COS) COS将数据分散存储在城市中多个不同的数据中心,其中某数据中心故障了,多AZ存储架构依然可以为云上客户提供稳定可靠的数据服务,云上数据可靠性是12个9,即99.9999999999%...列举一下几个场景: 场景一: CBS快照跨地域能力建设 当前云平台CBS数据可靠性的能力在地域粒度,对于公司核心数据要求多地域备份时,需要业务通过调用云API来实现;高可用能力建设核心思路: 1.定期快照复制新
3台不停止服务的最低限度是2台(X/2+1),而5台的最低限度是3台。 我们应该保证,集群中最低有3台ZooKeeper是启动的。...此外,重启时应保证先重启myid最小的机器,由小向大进行重启 Leader无论其myid大小,都放到最后重启 因为ZooKeeper的机制中,myid大的会向小的发起连接,而小的不会向大的发起连接。.../conf/zoo.cfgMode: follower 将其扩容为5节点的ZooKeeper 先查看原先的ZooKeeper集群情况 echo mntr|nc localhost 2181 这条4字命令可以查看集群的情况...STOPPED 查看新Leader ZooKeeper会尽可能的选择myid最大的机器为Leader,因此原本的idc02-kafka-ds-04其myid为5变为了Leader 12345 [hadoop...然后只要将现在的5台再缩小到3台且不包括原本myid为1-2的机器,就完成了迁移 将5台缩小回3台 修改idc02-kafka-ds-02 根据前面的注意事项,我们此时5台集群中启动的数量不得少于3台,
云容灾架构建设新范式——云上混沌工程 为了减少一个云厂商服务或者云产品不可用时给业务带来的影响,云容灾架构就是一个有效的方案,但是这仅仅是一个理论上可行的方案,事实是否真的有效呢?...有没有一个标准的范式可以帮助用云的团队验证容灾方案有效性,以及进行常态化的容灾稳定性建设呢?有,便是开展云上的混沌工程。 什么是云上混沌工程?...在云上开展混沌工程,可以帮助用户发现平时难以发现的容灾设计隐患并及时修复验证。将云上混沌工程纳入到业务系统的发展周期中是科学,有必要的。...腾讯云混沌异地多活容灾客户案例 上图便是一个针对云数据库腾讯云&用户IDC容灾混沌场景,通过引入「云数据库MySQL不可用」以及「云数据库Redis不可用」故障,模拟数据库单云灾难场景。...用于验证业务架构是否能够及时切换到IDC环境数据库,达到业务容灾要求。通过该云上的混沌演练,可以验证云上云下的容灾架构有效性以及故障应急处理机制是否合理,也可显著提高用户面对单云数据库灾难时的信心。
随着业务对持续性要求越来越高,云上不少企业对跨AZ或多地域的容灾建设有强烈的诉求。...本文也平台容灾能力建设优势、云上容灾典型方案以及一站式构建三个方面来进行详细的说明。 1.云平台容灾建设的优势 借助云平台能力有效提升容灾建设效率,同时能减少建设成本。 1)降低容灾建设的技术门槛。...云上核心产品拥有跨地域或者跨可用区容灾能力,减少企业对众多开源方案的依赖和研究,同时还能得到云产品的SLA稳定性的保障。 2)组件HA切换能力建设。...云上通过控制台便捷的操作,一站式进行容灾建设;同时减少对社区开源软件维护以及二次开发的人力成本。...以腾讯云为例,构建同城双活的数据库单写整体业务部署架构: image.png 2.2 异地灾备 异地容灾主要满足客户数据安全需求。
在数字化转型的热潮中,业务数据无疑是企业的生命线。无论业务部署在IDC还是云平台,对数据备份都是有强烈诉求。随着共享经济的不断深化,越来越多企业将自身业务逐渐的搬迁到了云上。...为了让企业能更好用好云平台的数据安全能力,本文重点云平台数据备份冷备能力,以腾讯云为例,主要从以下两个维度介绍:同城数据冷备能解决企业什么问题,达到怎么样业务容灾效果?...,数据备份存储在COS,具备地域级别容灾,RPO依赖于数据库备份周期以及时间。...本文小结同城冷备方案,在云平台的协助下,企业几乎0成本并拥有同城数据冷备能力来保障业务生命线。指标详细说明容灾能力具备同地域(不同可用区)数据备份能力,不具备不同地域的能力。...3.容灾演练能力建设,增加平时运维成本以及自动化工具开发功能。
企业业务部署在云上,借助云平台的能力,企业几乎“零”成本拥有同地域数据备份的能力。...即使云平台在建设数据中心之前,会遵循机房建设标准来选址,但是对于极端情况自然灾害,例如地震,台风等等,对同地域备份安全能力有非常大的风险,因此本文重点阐述腾讯云对异地数据冷备解决方案。1....异地数据冷备方案2.1 API实现方案数据备份:云平台的数据库数据备份均为同地域,因此需要将该备份数据上传到异地COS存储桶。...目前云函数支持备份产品如下:图片跨地域复制:目前云函数只支持同地域备份,即备份数据库和cos需要同地域,因此通过存储桶的跨地域复制能力,将对应的备份文件复制到异地的存储桶。...2.3 数据库备份服务数据库备份服务拥有一套完整的数据备份和数据恢复解决方案,具备实时增量备份以及快速的数据恢复能力,同时具备异地容灾能力。
传统模式下企业的数据容灾建设方案 灾备是一项综合系统工程,灾备技术涉及到数据的复制、数据及应用的切换、数据的删除、数据的加密与传输、数据存储等多个技术的具体应用,系统容灾建设中,最重要的是数据容灾,目前...阿里云数据容灾建设方案 随着云时代的到来,大多企业在公有云上建立自己的数据中心,或者在本地建立私有云,或者公用云与私有云结合的混合云,不管以什么形式存在,灾备的建设一定会考虑云的因素。...混合云存储阵列:阿里云混合云存储阵列支持用户在阵列本地存储空间中建立多版本快照,并将各时间的快照镜像上传到云端存储作为备份,混合云存储阵列也能支持本地存储和云端存储的文件数据同步,实现数据在云端的异地容灾存放...企业可用自己设计备份或灾备策略,实用数据库本身的技术,把数据容灾到云端,也可用实用云厂商的方案,在线下和线上之间进行灾备实施,或者在云山进行灾备设计。...腾讯云数据容灾建设方案 222.jpg 腾讯云数据灾备架构图 腾讯云数据灾备优势: ---- 1、高兼容性:同时支持虚拟环境和物理环境中的备份数据成功上云,覆盖主流虚拟机、数据库、邮件系统和非结构化文件
当前,市场上常见的容灾模式可分为同城容灾、异地容灾、双活数据中心、两地三中心几种。...同城容灾 同城容灾是在同城或相近区域内(≤200KM)建立两个数据中心:一个为数据中心,负责日常生产运行;另一个为灾难备份中心,负责在灾难发生后的应用系统运行。...同城灾难备份一般用于防范火灾、建筑物破坏、供电故障、计算机系统及人为破坏引起的灾难。 异地容灾 异地容灾主备中心之间的距离较远(>200KM)因此一般采用异步镜像,会有少量的数据丢失。...两地三中心 结合近年国内出现的大范围自然灾害,以同城双中心加异地灾备中心的“两地三中心”的灾备模式也随之出现,这一方案兼具高可用性和灾难备份的能力。...异地灾备中心是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。
为什么业务容器化之后,多活容灾变得更具挑战? 不像之前使用CVM或者物理机部署时,业务容器化之后,底层资源的可控程度更弱,应用实例生命周期更短、变化更快,这就给业务做容灾部署带来了更大的难度。...当每个地域/可用区的集群数量很多时,这个动作也会变的较重。 有的云管平台,每个集群底层的资源拓扑并不是一层不变的,有些集群包含了多个Zone的资源,有些集群只有单个Zone的资源。...业务需要底层多活容灾部署,到底是业务自己去根据复杂的底层集群和资源拓扑去精细化构建,还是说应该由容器平台来完全兜底,并作为一种不对用户感知的默认的产品能力?...不同的业务场景对容灾的需求存在差异,所以底层PaaS平台需要提供不同的业务容灾部署策略,客户根据自己的容灾需求配置部署策略。...所以,业务的容灾,是需要业务和应用托管平台都关注的事情,业务评估自己的容灾场景,平台提供对应的容灾部署能力。
容灾备份的区别 容灾(Disaster Tolerance):就是在上述的灾难发生时,在保证生产系统的数据尽量少丢失的情况下,保持生存系统的业务不间断地运行。...现在的容灾系统都包含着灾难恢复的功能,所以本文的讨论除了包括容灾方面的内容,还包括了 灾难恢复的部分内容。高性能、高可用平台架构的演变过程。...容灾系统在企业中给与数据安全系数相当高的保障,但是容灾系统倒是是什么,他们是什么意思?恐怕连正在使用容灾备份的网络管理人员都不能解释。本文用最浅显的语言给大家解释容灾备份到底是什么。...容灾不能替换备份 容灾系统会完整地把生产系统的任何变化复制到容灾端去,包括不想让它复制的工作,比如不小心把计费系统内的用户信息表删除了,同时容灾端的 用户信息表也会被完整地删除。...如果是同步容灾,那容灾端同时就删除了;如果是异步容灾,那容灾端在数据异步复制的间隔内就会被删除。这时就需要从备份系统 中取出最新备份,来恢复被错误删除的信息。
引子 先介绍几个概念,同步一下认知: 容灾:是指系统冗余部署,当一处由于意外停止工作,整个系统应用还可以正常工作。 容错:是指在运行中出现错误(如上下游故障或概率性失败)仍可正常提供服务。...其他没有故障的是可靠的。 稳定性:这个业界没有明确的定义,我的理解是:在受到各种干扰时仍然能够提供符合预期的服务的能力。 从要求的严格程度上:可用性<可靠性<稳定性。...可用性和可靠性更侧重于容灾,而对稳定性同时包含容灾和容错。 服务的容灾 服务容灾的解决方案就是冗余。多几个备份来切换。常用的有N+1容灾和两地三中心。N和中心实际上都是机房的意思。...N是数据中心的电力配置部分。电力配置有市电和备用发动机供电,但是一般互联网公司是不支持备用发动机供电的。所以一般一个机房就是一个N。 N+1容灾就是要多出一个机房做容灾。...这个备份的冷备和热备不同于数据库的冷备和热备。数据库的冷备是离线备份,就是不接收新流量的情况下备份。热备是一边接收流量一边备份。 而通常服务的冷备是服务还没有接收流量。
MSHA 云原生多活容灾解决方案 [1] ,也发布了混合云多活容灾产品能力。...混合云容灾目标 业务容灾需求归纳如下: 云上云下互容灾,切换 RTO 为分钟级。 期望云上云下相互容灾,继续发挥 IDC 的价值,且不 100% 依赖于云。...解决方案 结合业务容灾需求和混合云 IDC+云形态的特点,采用应用双活架构能够较好的满足业务容灾诉求。...改造内容 应用上云 选择跟自建 IDC 较近的阿里云地域,云上完全冗余的部署一套应用、中间件和数据库,以便搭建云上云下双活容灾架构。在这个 Demo 案例中,选择杭州 Region 作为容灾单元。...总结 在本篇文章中,我们介绍了 MSHA 多活容灾助力企业进行混合云应用双活容灾建设的实践案例,给出了容灾架构建设实践方法,同时利用 Chaos 故障演练产品注入真实故障,来验证故障场景业务容灾能力是否符合预期
高度自动化的云容灾解决方案,充分利用云和云原生容灾工具的特性,保障容灾业务在腾讯云上的稳定性和高可用性。与传统容灾工具相比,HyperBDR云容灾可帮助企业在腾讯云上节约90%+的容灾存储成本。...以下内容将传统容灾机制和万博智云HyperBDR的两种容灾机制做了对比,以展现利用网关数据同步方式和无主机数据同步方式,可以最大程度节约容灾成本,实现普惠容灾。...如,上海某金融公司现有以下规格的主机需要部署腾讯云容灾: 图片 传统容灾方式 图片 传统的容灾需要1:1预配置云资源,购买20台腾讯云CVM一年的价格为¥176,640.00,同步主机数据所需的5TB...万博智云通过调用云API接口,实现云资源的创建和编排,实现了更加自动化的容灾体验。...由此可见,HyperBDR的对象存储容灾是最具性价比的腾讯云容灾解决方案。
领取专属 10元无门槛券
手把手带您无忧上云