腾讯云数据库 MySQL 提供了灾备实例的功能,如果一个实例未配置灾备实例,当实例的主备节点同时,或者实例所在的地域出现严重故障时,业务受影响的时间可能会超过预期。
4个指标怎么看呢?实际上是在 已经搭建主从同步的slave端执行 show slave status的结果,如下所示:
企业业务敏感程度差异,对容灾指标RPO&RTO要求也不同。之前两篇文章主要介绍数据冷备,主要特点是数据备份存储非实时,备份系统存储数据通常昨天的数据,当灾难真正来临的时候,今天新产生的数据会丢失情况。对于企业核心业务来讲,业务恢复(RTO)可以接受小时级别,但是对于数据无法接受丢失,即RPO接近为“零”。结合腾讯云数据备份能力,本文重点介绍数据热备解决方案,旨在让客户上好云,用好云,管好云。
实现业务连续性的技术手段通常包括高可用性和灾备恢复两种,所以本文讲述的是在腾讯云上实现业务连续性的解决方案。
风险无处不在,包括自然灾害以及突发事件等,有时候我们无法预测到一些风险,比如天津港爆炸事件。IT领域也一样,总是有意想不到的事情,风险具有不可预测性,万全之策就是做好灾难应对的各种准备。
容错(fault tolerance)指的是, 单个组件发生故障时,业务还能继续运行。
通常金融、医疗等行业的大型企业,可以建设传统灾备中心来保障核心业务的安全,但是每年在灾备上的花费都是一笔不小的数目。
灾备一体机是集软件和硬件于一体的灾备解决方案。灾备一体机的出现,为用户提供了集“计算+存储+灾备”三位一体的解决方案。
下文以腾讯云数据库 MySQL为例,介绍如何充分利用腾讯云的优势,减轻DBA的负担,轻松来搭建数据库。
2001年的“911事件”中,没有远程备份的企业都遭受了巨大损失,甚至部分公司因为核心业务部署在公司大楼而又没有远程备份,导致公司业务无法继续运营而倒闭。美国“911事件”后,全球用户提升了对灾备的重视程度,异地灾备建设一时成为趋势。
业务数据备份采用热备方式,容灾指标RPO接近“零”;但是RTO指标还是依赖于业务部署测试自动化能力。业务会进一步需要,在数据热备技术架构下,在成本可控的情况下,是否能进一步提升RTO指标呢? 本文结合云平台的能力,来进一步讨论这个话题。
相对于过去单体或 SOA 架构,建设微服务架构所依赖的组件发生了改变,因此分析与设计高可用容灾架构方案的思路也随之改变,本文对微服务架构落地过程中的几种常见容灾高可用方案展开分析。
以年为单位,一年时间为 t = 365 * 24 * 60 = 525600 分钟。
作者介绍 万守兵:腾讯云行业架构师,对云上双活架构、迁移方案有比较深的了解,现主要负责腾讯云泛互行业TOP级客户的解决方案架构工作。 高可用挑战 1. 高可用挑战:时间要求 2. 高可用挑战:各种不稳定的原因 常见事故及问题归类如下: 互联网通用架构和分层 典型互联网架构分层设计如下: 系统正交分解如下: 分类 服务治理 目标 技术 架构 监控层外层客户端SLA、攻防/扫描/审计 CDN合理/稳定
容灾体系能否第一时间恢复数据成为容灾体系是否合格的核心指标,对于业务连续性来说也至关重要。腾讯云数据库灾备解决方案的最佳复原时间目标(RTO)也降低到秒级,彻底解决单机房网络、光缆挖断等不可控故障给业务带来的长时间停服不可用。
无论是哪种数据库都需要面临数据库数据备份和恢复的问题,使用UCACHE灾备云进行Oracle实时复制数据、搬迁数据功能来设计Oracle数据库备份和恢复解决方案,支持定时备份、实时备份,增量备份,同时可开展异地灾备,是Oracle数据库灾备/恢复的完美解决方案。
上篇文章讲到了Ceph在灾备方面有三大神兵利器:故障域、RBD异地灾备、RGW异地灾备。那么本文讲述下剩下的两大利器RBD异地灾备和RGW异地灾备
一、高可用的挑战 1、高可用挑战-要求 image.png 2、高可用挑战-各种不稳定的来源 常见事故及问题归类如下: image.png 二、互联网通用架构和分层 典型互联网架构分层设计如下: image.png 系统正交分解如下: 服务治理目标 技术架构 监控层 外层 客户端SLA 攻防/扫描/审计 CDN合理/稳定 DNS合理/稳定 流量峰值 CDN DNSPOD/Ip直连 高防 客户端监控 CDN监控 DNSPOD监控 安全监控 接入层 异地多活 服务
业务系统容灾到其他灾备中心后,怎么才能知道容灾系统的RPO、RTO是否达标?由于硬件设施迭代,业务系统也必须跟着升级,怎么才能确保系统升级后高可用?为了验证这些问题,企业会定期进行个性化的灾备演练。
随着业务对持续性要求越来越高,云上不少企业对跨AZ或多地域的容灾建设有强烈的诉求。当企业内部经过评估选定容灾建设整体方向,即同城双活;需要对方案进行验证,包括组件容灾能力建设,数据同步以及切换验证等。通常对组件容灾能力建设和验证会花费大量时间,如果测试不符合预期,对之前调研、部署以及测试人力和时间成本带来较大耗费。因此借助云平台能力“一站式”提升系统容灾能力,助力企业降本增效。
在云网融合大数据时代,数据已经成为重要的生产要素。特别是棱镜门、永恒之蓝、汶川大地震这类造成大规模数据丢失和泄漏的人为或自然灾害事件发生后,中国相继出台了一系列的法律法规,对各组织机构的数据安全保护条件进行限定,如 2016 年颁布的《中华人民共和国网络安全法》、 2021 年全国人民代表大会通过的《数据安全法》等。
数据同步强调准确性和实时性。 两个机房的数据根据不同的活性模式,数据域可能略有差异,但是相同的数据域必须要保障一致性。
近年来,中小型金融企业的信息化程度不断提高,信息系统已经成为中小型金融企业经营管理和业务操作中不可或缺的一部分。随着金融信息化的不断普及,金融数据的安全问题也变得尤为重要,一旦金融企业的数据中心发生灾难,都有可能引起巨大的经济损失,影响金融企业的社会声誉,甚至引发金融秩序混乱。因此如何守护好这条数据安全“生命线”是金融企业在信息化转型道路上的最大挑战。
水滴公司是中国互联网健康保险保障第一平台,用互联网科技助推广大人民群众有保可医,保障亿万家庭。截至2020年3月,水滴公司有超过3.1亿独立付费用户。 与死神赛跑的水滴筹业务,救援速度也在不断加速,在平台通过提现公示的求助项目中,95%以上24小时内完成打款,60%以上在8小时内完成打款。病情紧急、急需大量医疗资金的患者还可申请“极速打款绿色通道”,在6小时内即可收到款项。截至2020年5月,水滴筹累计帮助困难大病家庭筹集医疗资金超过300亿元,有9亿多人次的好心人在平台上献出爱心,帮助困难患病家庭
今天跟大家分享的题目为《CKV+异地容灾探索和实践》。CKV+是一个兼容redis协议的内存数据库,现在大部分用户对内存数据库的要求越来越高,对一致性、异地容灾等方面也提出更高的要求。下面从过往经验教训、可用性&一致性、CKV+架构演进、CKV+单活多可用区和CKV+多活架构探索等方面跟分享一些关于容灾的实践和思考。
在业务系统上云的过程中,业务部署的高可用和容灾是一个要考虑的关键因素。如今很多系统都采用分布式的架构,从架构层面避免单点故障。分布式系统中,任意一个节点故障,其他节点可以快速接管业务,避免整个业务系统宕机。 这就对IaaS层资源提出了要求,即单节点故障,不影响其他节点。 由于公有云是一个多租户的环境,一台物理机上会运行多个虚拟机,如果分布式系统的多个虚拟机落到了同一台物理机上,当物理机发生故障时,多个分布式节点同时故障,就有可能造成整个系统宕机。 那么在公有云的IaaS层,如何才能保证分布式系统部署的高可用呢? 使用腾讯云的分散置放群组可以解决这个问题。
近年来随着数字化转型的不断深入,银行电子化程度逐步提升,线上金融场景的落地推广对金融机构的业务连续性提出了更为严苛的要求。
云计算的成本优势、便捷访问和弹性伸缩等优势驱动着政府机构、行业企业或个人积极上云,云上应用无处不在。随着企业核心数据的不断累积,如何保障数据的安全性和业务连续性成为不得不提上日程的问题。
在很多的时候,随着工作的持续开展,可能会接手更多的服务器资源,这个时候我们手里就不但是一两台服务器那么简单,可能几十个,上百个,甚至上千个,这个时候服务器信息的维护就变得额外重要,抛开业务线的规划,对于DBA来说,掌握服务器的信息,做到知根知底,才能在问题发生的时候合理处理问题。 服务器信息可以分成几个方面来看,比如操作系统情况,内核版本,硬盘,内存,空间使用情况,累计运行时间,数据库实例运行时间,系统中的swap争用情况等等,尽可能根据实际的情况进行一些维度的划分和细粒度的归纳。 比如说在生产中,考虑容灾
DataGuard,数据卫士,一种数据库级别的高可用性(HA)方案,用作数据容灾解决方案。对于联机事务处理(OLTP,数据量不太大)非常合适,对于联机分析处理(OLAP,数据量太大),只能选择关键数据创建DG,常规数据,选择其他方式备份。
其实,TencentDB已经和珍爱网“隐婚”数年了,请允许我正式向大家介绍我的“另一半”:
灾备: 是指容灾和备份。容灾是为了在遭遇灾害时能保证信息系统能正常运行,帮助企业实现业务7*24小时连续性的目标,备份是为了应对灾难来临时造成的数据丢失问题。容灾备份产品的最终目标是帮助企业应对人为误操作、软件错误、病毒入侵等“软”性灾害以及硬件故障、自然灾害等“硬”性灾害。
云原生数据库TDSQL-C作为腾讯云架构平台部核心数据库产品之一,致力于为云上ToB用户和公司自研业务提供集高性能、低成本、大存储、低延迟、秒级扩缩容、极速回档、Serverless化七大特性于一体的企业级数据库服务。本文将给大家分享《TDSQL-C (原CynosDB)容灾的实践和探索》,主要内容有以下三个方面:
热备:备份设备与主设备一起工作运转,当主设备故障时,备份设备能立即取代主设备的工作
两地三中心 随着IT应用的快速发展,金融,银行,政府等越来越多的用户要求核心业务7*24不断网,不断电持续运行,进而出现了两地三中心的方案,是一些大型企业因为大自然的灾害而在同城选择两个机房异地选择一个机房而组成的称两地三中心,这样的方案具备高可用和灾难备份能力。 同城双机房指的是在同一个城市或相邻的城市建立两个相同的系统,双中心具备等同的业务处理能力并通过高速链路实时数据同步,日常情况下可同时分担业务及管理系统的运行,并可切换运行,当意外的情况下基本在保证不丢失数据的情况下可进行灾备应急切换,保证业务的连续性, 异地灾备是考虑因为特殊的自然现象而在外地做的备份,实现双机房的数据备份,当同城机房因为自然灾害等出现意外情况,异地灾备的备份数据可以进行恢复,以保证数据的完整性。 目前针对两地三中心的需求方案,UCACHE灾备云利用自身的华北IDC数据中心优势以及配套的软硬件帮企业实现了低成本,灵活的方案优势,减少了企业前期的大量投资以及后期的维护成本费用。
在“十四五规划”中,数字中国、数字经济、数字孪生、数字转型等相关词汇出现60余次,由此可见国家对各行业数字化转型的决心。但是目前,除了互联网行业的部分企业和各个大型企业,已经完成数字化转型,中小企业的数字化程度仍处于较低水平。中小企业是我国市场的主体,因此我国各行业的数字化整体水平仍有很大的上升发展空间。
数据库作为企业数据的管理软件,是企业的核心资产,需要避免单点灾难,因此数据库灾备需求应运而生。
作者:赵珣 腾讯云监控工程师 简介 云数据库 MySQL(TencentDB for MySQL)是腾讯云基于开源数据库 MySQL 专业打造的一种高性能分布式数据存储服务,提供了备份恢复、监控、容灾、快速扩容、数据传输等全套解决方案,简化数据库运维工作,让用户专注于业务发展。 云数据库 MySQL 的优势: 快速便捷的数据库服务交付能力,在几分钟内部署可扩展的 MySQL,并可按需弹性升降配置; 真正 100% 的 MySQL 兼容能力,主流 MySQL 分支完全兼容; 提供热备、冷备、binlog
当下,随着数字化技术不断深入,愈来愈多企业将核心业务搬到线上。业务系统高可用、可扩展、容灾能力决定企业系统的连续性,中间件作为构建企业核心系统的重要组成部分,其高可用容灾能力也将决定应用系统的。本文结合腾讯云中间件各PaaS产品的容灾能力及实践,以一个行业头部客户业务容灾实践举例,来展开说明基于腾讯云中间件PaaS层相关产品的实践。
为帮助开发者更好的了解和运用数据库,腾讯云数据库团队特出品《深入浅出理解云数据库》系列文章,从数据库的基本概念到云数据库特性及应用,从数据库基础原理知识到腾讯云经典实战案例解读,带你走进云数据库的世界。关注“腾讯云数据库”微信公众号,开启2020年的DB修炼之旅。 第一回请点击:数据库的基本概念和云数据库特性 第二回请点击:云数据库的市场应用及基础原理知识 1 PartⅠ 腾讯云数据库产品总览 接下来的章节中我们以腾讯云数据库为例,来详细解读云数据库的功能和特性等。 首先来让我们用一张表来看清楚腾讯
【案例】蜂巢链:基于区块链的资产证劵化
文章主要介绍了分布式数据库在金融互联网场景下的设计和实现,包括DCDB的架构、基础环境、实例配置、功能、性能、以及扩展性。同时,还探讨了分布式数据库在云原生架构下的应用和挑战,以及TDSQL在金融云上的解决方案和案例。
长通物流是一家基于供应链管理集运输、仓储、物流配送、产品代理一体化的全方位综合物流服务商。随着社会的发展,行业环境的改变,为满足用户的需求不断创新,现在先研发第三代物流管理系统,预期8月部署上线,新系统的部署采用云服务的方式,满足新业务的安全需求、访问需求等。
| 作者:杨壮壮 ,腾讯PCG运营开发工程师 ,目前主要从事 MDB(MySQL 云管平台)的后台开发与技术运营的工作,是一个做开发的DBA。熟悉腾讯自研数据库TDSQL的架构原理、集群管理维护、内核SQL优化等。MDB团队承载着整个PCG 关系型数据库的管理与运维工作,支撑着腾讯视频、看点等业务稳定运行。 1 Part1 前言 在今年的三月份,我们举办过一届数据库武林大会,在这场活动沙龙中,有辩手犀利地指出,数据库运维的薪资水平和数据库使用人数并不成正比,有数据表明一些小众但强大的数据库,其DBA的平均
场景二:硬盘故障,而且坏的很彻底,硬盘数据完全读不出来了(binlog损毁,无法恢复全部数据)
领取专属 10元无门槛券
手把手带您无忧上云