IDC时代,业务对网络容灾参与较少,主要依赖数据中心网络容灾建设程度;当到了云的时代,云服务商将底层网络能力产品化后,云上客户更多参与网络容灾建设,提升业务稳定性。...本文从云网络概述,云网络容灾复杂度以及典型案例来介绍云网络容灾建设。 1.云网络概述 云网络概述主要分为云服务商基础设施网络架构和云产品两部分,让云上客户更加深入了解云网络,用好云网络。...2)跨区或者跨地域云基础设施容灾能力。 通常云服务厂家数据中心建设均有容灾能力,这里建议还是选择大厂。 3)IDC到云上网络高可用建设。...混合云容灾模式,这里考虑到IDC和云上线路容灾情况,一般建议两条专线接入不同的POP点来进行容灾建设;同时建立VPN或者GRE公网逃生通道来紧急恢复业务。...image.png 3.2 混合云网络容灾 混合云网络容灾分为两个部分: 1)idc和云机房之间线路容灾,主要线路分为专线和VPN。
本文结合云平台公网能力,从网络平台角度来分析容灾建设可行性。...2.公网出口容灾方案 2.1 IDC和云平台出口互为主备 正常情况下,IDC和云平台公网出口流量是烟囱式,互不交叉;当IDC公网出口异常,流量切换到云平台,同样云平台公网出口异常,流量切换到IDC。...云平台NAT网关不支持流量导入,需要企业在VPC自建流量转发系统,推荐流量出口选择直接绑定EIP模式,流量更可控。 整体公网出口容灾方案如下: image.png 2.1.1 云平台切换方案。...2.1.2 IDC容灾切换方案 正常情况下,IDC业务流量通过NAT访问公网,如上路绿色线条标识。...2.2 IDC机房公网出口容灾方案 正常情况下,IDC和云平台公网出口流量是烟囱式,互不交叉;当IDC公网出口异常,流量切换到IDC备用公网出口通道,同样云平台公网出口异常,流量切换到云平台公网出口通道
本文从容灾概念,决策因素,典型案例和方案对比进行说明,希望容灾方案的选择有所帮助。 1.容灾概念 将容灾这个词,分开来看“容”和“灾”。...典型案例 虽然这里对“容灾”概念进行扩展,一般指同地域以及跨地域粒度的容灾;以云上客户案例同时结合腾讯云产品能力,分别对同城容灾,异地灾备以及异地多活进行说明。...3.1 异地容灾 异地容灾的核心特征: 1)容灾范围:地域粒度的容灾。 2)流量分布:单地域承载100%业务流量。 3)数据存储:数据库以及存储均在异地做冷备,数据单向同步。...以下是云上某个金融公司异地容灾架构: 1)接入层和业务层均使用低配以及业务单台服务器部署方式,主要提升业务快速扩容能力,一方面主可用区异常,借助腾讯弹性伸缩AS能快速扩容,另一方面业务发布版本在不同地域保持一致...2)该数据层使用云上PAAS产品,云上产品均支持异地容灾能力,同时操作便捷。如CDB和COS均通过云上控制台按钮式方式建设异地容灾能力;而对于es通过ccr方式进行数据复制。
但是基于混合云部署的业务系统往往复杂性高,维护成本大,因此也为业务稳定性带来了不小的挑战,为保证业务的稳定性,进行有规律的容灾演练是一种科学的方式。...但是在复杂的混合云环境中进行容灾演练本身就比较复杂,涉及的云资源之多,进行混合云容灾演练的门槛高。...混合云容灾的必要性混合云结合了公有云和私有云的特点,因此在多云部署的环境中,负载均衡、数据安全、服务安全稳定以及扩容伸缩等方面都将变得更加复杂。...混沌演练对混合云容灾的价值体现腾讯云混沌提供了对云上资源类型CLB、CVM、专线、数据库等对象类型的故障,通过混沌演练可以了解云服务不可用时的业务表现,检验故障告警的有效性,同时也可以验证脱离公有云后自身私有云架构的容灾表现...如何快速进行混合云容灾混沌演练腾讯云混沌演练工程结合行业经验,生成了一个混合云容灾演练经验模板,可通过该模板快速生成演练:前往腾讯云混沌演练平台【概览】选择「混合云容灾演练」行业经验模版。
安全容灾解决方案同业务容灾解决方案的区别: (1)业务容灾解决方案倾向业务架构内因解决问题。...业务容灾问题发生的普遍原因是基于业务访问量,架构负载,业务逻辑等内部可用性层面导致,解决思路多以异地灾备,混合云多活灾备, 数据迁移同步等层面解决。 (2)安全容灾解决方案倾向安全行为外因解决问题。...安全容灾问题的普遍原因是基于外部安全攻击行为导致,解决思路多以数据灾备,主机灾备,安全防御,安全检测等思路解决。 安全的根本目的是:保障业务的连续性。 不能片面地为了“安全”而安全。...遭勒索攻擊的Colonial Pipeline花了大筆冤妄錢,換到不中用的解密工具:https://www.ithome.com.tw/news/144418 四.云安全方案架构 image.png 安全容灾方案是基础兜底...服务于 CIA全过程 五.云主机安全容灾解决方案 1.第一步:快照备份,全盘快照 (1)创建云上定期快照:https://cloud.tencent.com/document/product/362/
腾讯云跨地域容灾方案DNSPod+CLB.ppt D监控介绍:https://support.dnspod.cn/Kb/showarticle/tsid/16/ D监控切换规则:https://
在至少有一个Leader存在的前提下,进行Zookeeper的在线增量、在线减量、在线迁移 在全过程中ZooKeeper不停止服务
数据存储容灾建设主要从数据可靠性和业务稳定性两个维度阐述。这两者有哪些区别呢?...企业通常使用数据存储产品主要为云硬盘(CBS)以及对象存储(CFS)。...1.数据可靠性 1.1 云硬盘(CBS) 云硬盘采用三副本的分布式机制,系统确认数据在三个副本中都完成写入后才会返回写入成功的响应。...1.2 对象存储(COS) COS将数据分散存储在城市中多个不同的数据中心,其中某数据中心故障了,多AZ存储架构依然可以为云上客户提供稳定可靠的数据服务,云上数据可靠性是12个9,即99.9999999999%...列举一下几个场景: 场景一: CBS快照跨地域能力建设 当前云平台CBS数据可靠性的能力在地域粒度,对于公司核心数据要求多地域备份时,需要业务通过调用云API来实现;高可用能力建设核心思路: 1.定期快照复制新
随着业务对持续性要求越来越高,云上不少企业对跨AZ或多地域的容灾建设有强烈的诉求。...通常对组件容灾能力建设和验证会花费大量时间,如果测试不符合预期,对之前调研、部署以及测试人力和时间成本带来较大耗费。因此借助云平台能力“一站式”提升系统容灾能力,助力企业降本增效。...本文也平台容灾能力建设优势、云上容灾典型方案以及一站式构建三个方面来进行详细的说明。 1.云平台容灾建设的优势 借助云平台能力有效提升容灾建设效率,同时能减少建设成本。 1)降低容灾建设的技术门槛。...以腾讯云为例,构建同城双活的数据库单写整体业务部署架构: image.png 2.2 异地灾备 异地容灾主要满足客户数据安全需求。...以腾讯云为例,构建异地灾备整体架构: image.png 3.一站式构建容灾能力 关于云上容灾能力概况,以腾讯云为例如下: 产品 多可用区实例 多地域实例 CLB 1.控制台支持购买多可用区实例。
3.云容灾优势 云容灾是一种基于云平台发展起来的服务模式。...云容灾结合云平台的计算、存储和带宽等诸多优势,相比传统容灾具备了多方面的优势: 基础设施减少 摒弃采购传统的灾备服务器,借助云平台供应商提供的计算和存储平台,或直接采用云容灾DRaaS应用服务。...4.云容灾级别和能力 参考传统容灾的级别划分,由于云容灾的基础设施采用了云平台,在云容灾的级别划分上,应用级和业务级的区别已经不大了,因此在这里将云容灾的容灾级别分为:数据级容灾、业务级容灾。...数据级云容灾:数据级云容灾是指通过云平台做数据的远程备份,在灾难发生之后要确保原有的数据不会丢失或者遭到破坏。...随着IT基础架构逐渐云化,容灾也面临着云化转型,不断涌现出更多的云容灾产品和方案。
为了让企业能更好用好云平台的数据安全能力,本文重点云平台数据备份冷备能力,以腾讯云为例,主要从以下两个维度介绍:同城数据冷备能解决企业什么问题,达到怎么样业务容灾效果?...,数据备份存储在COS,具备地域级别容灾,RPO依赖于数据库备份周期以及时间。...如果企业有业务切回需求,主要依赖于dts数据同步工具,当追平数据后,在业务低峰期将业务切回之前可用区。3....本文小结同城冷备方案,在云平台的协助下,企业几乎0成本并拥有同城数据冷备能力来保障业务生命线。指标详细说明容灾能力具备同地域(不同可用区)数据备份能力,不具备不同地域的能力。...3.容灾演练能力建设,增加平时运维成本以及自动化工具开发功能。
企业业务部署在云上,借助云平台的能力,企业几乎“零”成本拥有同地域数据备份的能力。...即使云平台在建设数据中心之前,会遵循机房建设标准来选址,但是对于极端情况自然灾害,例如地震,台风等等,对同地域备份安全能力有非常大的风险,因此本文重点阐述腾讯云对异地数据冷备解决方案。1....2.2 云函数和存储桶复制结合实现方案数据备份:目前存储桶通过云函数集成了数据备份能力,通过云函数自动拉取备份文件,同时将数据备份到存储桶。...2.3 数据库备份服务数据库备份服务拥有一套完整的数据备份和数据恢复解决方案,具备实时增量备份以及快速的数据恢复能力,同时具备异地容灾能力。...如果企业有业务切回需求,数据库依赖于dts数据同步工具,cos通过日志进行人工补录,待两端数据一致后,在业务低峰期将业务切回之前地域。
云容灾架构建设新范式——云上混沌工程 为了减少一个云厂商服务或者云产品不可用时给业务带来的影响,云容灾架构就是一个有效的方案,但是这仅仅是一个理论上可行的方案,事实是否真的有效呢?...有没有一个标准的范式可以帮助用云的团队验证容灾方案有效性,以及进行常态化的容灾稳定性建设呢?有,便是开展云上的混沌工程。 什么是云上混沌工程?...在云上开展混沌工程,可以帮助用户发现平时难以发现的容灾设计隐患并及时修复验证。将云上混沌工程纳入到业务系统的发展周期中是科学,有必要的。...腾讯云混沌异地多活容灾客户案例 上图便是一个针对云数据库腾讯云&用户IDC容灾混沌场景,通过引入「云数据库MySQL不可用」以及「云数据库Redis不可用」故障,模拟数据库单云灾难场景。...用于验证业务架构是否能够及时切换到IDC环境数据库,达到业务容灾要求。通过该云上的混沌演练,可以验证云上云下的容灾架构有效性以及故障应急处理机制是否合理,也可显著提高用户面对单云数据库灾难时的信心。
容灾系统在企业中给与数据安全系数相当高的保障,但是容灾系统倒是是什么,他们是什么意思?恐怕连正在使用容灾备份的网络管理人员都不能解释。本文用最浅显的语言给大家解释容灾备份到底是什么。...容灾不可少 那么建设了备份系统,是否就不需要容灾备份系统?...容灾不能替换备份 容灾系统会完整地把生产系统的任何变化复制到容灾端去,包括不想让它复制的工作,比如不小心把计费系统内的用户信息表删除了,同时容灾端的 用户信息表也会被完整地删除。...如果是同步容灾,那容灾端同时就删除了;如果是异步容灾,那容灾端在数据异步复制的间隔内就会被删除。这时就需要从备份系统 中取出最新备份,来恢复被错误删除的信息。...备份系统+异地容灾系统 这是一个较为理想化的容灾系统一体化解决方案,能够在很大程度上避免各种可能的错误。 容灾恢复等级 ? 灾难恢复层次 ? 灾备技术层次 ? 1.1 磁盘阵列灾备技术 ?
MSHA 云原生多活容灾解决方案 [1] ,也发布了混合云多活容灾产品能力。...混合云容灾目标 业务容灾需求归纳如下: 云上云下互容灾,切换 RTO 为分钟级。 期望云上云下相互容灾,继续发挥 IDC 的价值,且不 100% 依赖于云。...解决方案 结合业务容灾需求和混合云 IDC+云形态的特点,采用应用双活架构能够较好的满足业务容灾诉求。...MSHA 控制台通过集成 DTS 同步组件,支持云上云下的数据同步(异步复制)。...容灾能力 RPO:<=1min(依赖于 DTS 同步性能) RTO:<=1min(依赖于 DTS 同步延迟,MSHA 组件实现秒级切换。
如果对于金融级的客户,还会考虑异地的灾备。则采用以下的架构。保障双活的公有云中断时,异地的私有云还能够在一定的时间内接管业务。 ?...五、数据灾备级的容灾方案 对于以上的方案,投入的代价较大,例如需要支付双活数据中心的高速通道费用、相同配置的云主机费用。...因此对于一般中型企业,也会提出将数据进行灾备,保障当主用数据中心中断时,原有的私有云能够在几个小时的时间内容逐步恢复业务系统的运行。...业内的实际方案较多,有基于硬件的灾备一体机,也有纯软件实现的方案。 1、例如下图,本地通过灾备一体机进行数据的压缩、加密、存储,同时在云端也进行一份灾备存储。...这样当业务系统中断时,可以选择在云端恢复、或线下私有云恢复。 ? 2、例如下图,也可以通过纯软件的方式进行灾备,直接将备份的文件放下云端、或线下私有云。 ?
综上所述,本文从云平台视角出发阐述应用层业务容灾建设,主要分为方案设计考虑纬度、复杂度以及云上客户案例三个方面。 1.应用容灾概述 1.1 应用部署 应用是否满足跨地域/可用区部署?...应用层调用链能接受跨区延时,一般以试点业务先观察,小步迭代方式逐步构建容灾能力。...容灾切换强依赖于调度系统以及配置系统稳定性。这里稳定性主要包括系统容灾能力和性能;遇到大规模故障,大量信息配置变更请求调度系统和配置系统要能扛住洪峰,是保障这个容灾方案的根基。...2.应用容灾复杂度 计算应用层容灾,主要考虑以下两个方面: 哪些节点执行任务。 这里要区分清楚哪些节点执行核心业务,这里会引入不同的复杂度。...当前腾讯云dts已经支持mysql双向同步功能,详情见https://cloud.tencent.com/document/product/571/59386。
为什么要做容灾? 你知道吗?自然灾害、设备故障、人为因素等都会造成业务中断。如今数字化时代,IT系统故障更会对公司业务造成难以估量的巨大经济损失。...3 容灾关键词 RPO(Recovery Point Objective) 数据恢复点目标,主要指的是业务系统最大能容忍的数据丢失量。...容灾体系介绍 1 数据中心 集团公司通过两地建立三个数据中心,通过双活、冷备等方式,实现两地三中心容灾架构。...2 体系建设 系统类型 --- 容灾策略 核心业务系统 --- 两地三活 关键平台系统 --- 同城双活 非关键系统 --- 异地冷备 3 技术方案 异地冷备 恢复能力 RTP≤1h RPO≤5min...容灾演习要求 每年进行容灾演练,所有核心业务与平台系统均要参演。 异地灾备恢复、同城双活切换、一键式自动化启停等恢复方式不断创新,要求演习规模逐年扩大和恢复效率逐年提升。 - End - ----
阿里云数据容灾建设方案 随着云时代的到来,大多企业在公有云上建立自己的数据中心,或者在本地建立私有云,或者公用云与私有云结合的混合云,不管以什么形式存在,灾备的建设一定会考虑云的因素。...111.jpg 阿里云数据灾备架构图 DTS:Data Transmission Service,是阿里云提供的一种支持多种数据源之间数据交互的数据流服务。...在数据库灾备解决方案中,使用阿里云DTS可实现各数据库间的数据迁移与实时同步,从而为数据库灾备打好最重要的基础。...企业可用自己设计备份或灾备策略,实用数据库本身的技术,把数据容灾到云端,也可用实用云厂商的方案,在线下和线上之间进行灾备实施,或者在云山进行灾备设计。...腾讯云数据容灾建设方案 222.jpg 腾讯云数据灾备架构图 腾讯云数据灾备优势: ---- 1、高兼容性:同时支持虚拟环境和物理环境中的备份数据成功上云,覆盖主流虚拟机、数据库、邮件系统和非结构化文件
接着上篇《做容灾,双活、多活、同城、异地、多云,到底应该怎么选?》,这篇聊聊公有云上应该如何建容灾,跟我们自建机房有什么区别,没看过的同学,建议先从上篇文章看一下。...做个简单总结就是,要想起到容灾效果,优先做到同城双活,再考虑异地双活或多活。从这个铺垫往下,谈谈如果我们上了云,高可用和容灾策略应该怎么选择。 我从几个方面来讲: 第一,先理解几个公有云的通用概念。...第三,关于云产品层面的高可用应该怎么做? 上面我主要讲的还是基础设施层面的内容,不同的AZ完全可以满足要求。 或者说的简单点,很多产品都是AZ级别的,在一个AZ不可用,但是可以跨AZ容灾访问。...就是在使用这类Region级别的产品,必须要要求在另一个Region有对应的容灾集群,出问题能切过去。...几个结论: 第一,云上做容灾,做高可用,先搞清楚云的几个关键概念,比如Region、AZ和IDC,以及它们之间的关系。 第二,云上的双活就选同城不同AZ即可,多活就选多Region。
领取专属 10元无门槛券
手把手带您无忧上云