首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

顾问-混沌】腾讯实践

架构建设新范式——上混沌工程 为了减少一个厂商服务或者产品不可用时给业务带来影响,架构就是一个有效方案,但是这仅仅是一个理论上可行方案,事实是否真的有效呢?...有没有一个标准范式可以帮助用团队验证方案有效性,以及进行常态化稳定性建设呢?有,便是开展混沌工程。 什么是上混沌工程?...在上开展混沌工程,可以帮助用户发现平时难以发现设计隐患并及时修复验证。将上混沌工程纳入到业务系统发展周期中是科学,有必要。...腾讯混沌异地多活客户案例 上图便是一个针对数据库腾讯&用户IDC混沌场景,通过引入「数据库MySQL不可用」以及「数据库Redis不可用」故障,模拟数据库单灾难场景。...用于验证业务架构是否能够及时切换到IDC环境数据库,达到业务要求。通过该混沌演练,可以验证架构有效性以及故障应急处理机制是否合理,也可显著提高用户面对单数据库灾难时信心。

55471
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    系列(三)——网络建设

    IDC时代,业务对网络参与较少,主要依赖数据中心网络建设程度;当到了时代,服务商将底层网络能力产品化后,上客户更多参与网络建设,提升业务稳定性。...以腾讯为例,在同地域选择机房地址时候,距离大于60公里,要求不同可用区延时小于3ms,来满足上客户同城建设基本需求。...image.png 4)如何应对整个公网异常极端情况 以腾讯为例,不同地域都会对接当前ISP;例如广州公网异常,上通过内网调度能力,结合网络负载能力,从不同地域ISP访问公网。...混合模式,这里考虑到IDC和上线路灾情况,一般建议两条专线接入不同POP点来进行建设;同时建立VPN或者GRE公网逃生通道来紧急恢复业务。...注意:对于入口VIP写死情况,客户端升级成本较高。 image.png 3.2 混合网络 混合网络分为两个部分: 1)idc和机房之间线路,主要线路分为专线和VPN。

    4.7K93

    最具性价比腾讯解决方案

    高度自动化解决方案,充分利用云和原生工具特性,保障业务在腾讯稳定性和高可用性。与传统工具相比,HyperBDR可帮助企业在腾讯上节约90%+存储成本。...如,上海某金融公司现有以下规格主机需要部署腾讯: 图片 传统方式 图片 传统需要1:1预配置资源,购买20台腾讯CVM一年价格为¥176,640.00,同步主机数据所需5TB...企业在腾讯使用5TB对象存储一年共需花费¥4422.45,这也是对象存储方式需要花费所有存储成本,比传统存储成本下降98.00%。...对象存储摆脱了计算资源束缚,让过程中存储成本也得以大幅度降低,让企业可以以备份价格享受业务系统在腾讯绝佳体验。...由此可见,HyperBDR对象存储是最具性价比腾讯解决方案。

    78800

    系列(七)——混合公网出口建设

    本文结合平台公网能力,从网络平台角度来分析建设可行性。...2.公网出口方案 2.1 IDC和平台出口互为主备 正常情况下,IDC和平台公网出口流量是烟囱式,互不交叉;当IDC公网出口异常,流量切换到平台,同样平台公网出口异常,流量切换到IDC。...平台NAT网关不支持流量导入,需要企业在VPC自建流量转发系统,推荐流量出口选择直接绑定EIP模式,流量更可控。 整体公网出口方案如下: image.png 2.1.1 平台切换方案。...2.1.2 IDC切换方案 正常情况下,IDC业务流量通过NAT访问公网,如上路绿色线条标识。...结合当前平台兼容性,方案关键点如下: 公有公网出口具备高可用能力。例如上海地域公网出口异常,通过腾讯内网将流量调度到南京或者广州公网出口,来恢复业务。

    3.1K124

    腾讯高可用和解决方案

    作者:melodytu(涂小敏) 导语:实现业务连续性技术手段通常包括高可用性和备恢复两种,所以本文其实讲述是在腾讯上实现业务连续性解决方案。...二、腾讯高可用解决方案 2.png 所处位置 腾讯产品 高可用 前端负载均衡 CLB CLB 可用性高达 99.95% 业务间通信层 CMQ 99.999999% 数据可靠性和 99.95% 服务可用性...9.png 三、腾讯解决方案 10.png 上图中三种应用场景是大家耳熟能详,从用户使用角度来理解场景,则有如下两种场景: 跨可用区 跨可用区需要保证一个CLB实例后端服务器...负载均衡CLB产品本身没有提供这样能力,跨地域能力是通过解析DNS+DNSPod产品来实现解析DNS产品提供了解析能力,DNSPod提供能力,网站宕机后自动切换DNS记录,多种切换算法...; 以上只涉及架构,混合方案参考下一期分享。

    11.6K265

    架构分析和选择策略

    3.优势 是一种基于平台发展起来服务模式。...结合平台计算、存储和带宽等诸多优势,相比传统具备了多方面的优势: 基础设施减少 摒弃采购传统备服务器,借助平台供应商提供计算和存储平台,或直接采用DRaaS应用服务。...4.级别和能力 参考传统级别划分,由于基础设施采用了平台,在级别划分上,应用级和业务级区别已经不大了,因此在这里将级别分为:数据级、业务级。...随着IT基础架构逐渐化,也面临着化转型,不断涌现出更多产品和方案。...它利用原生服务,帮助用户实现基于平台备份与,利用底层不同数据技术,及原生编排能力,实现一键式演练。

    2.6K30

    腾讯Elasticsearch重磅发布——多可用区功能

    为了满足客户对数据可靠性、服务稳定性及方面越来越严苛需求,腾讯Elasticsearch于近期推出了集群跨可用区功能。目前腾讯Elasticsearch集群支持跨两个可用区部署集群。...由于开启多可用区集群,必须开启专用主节点,且最小三个,所以能支持多可用区功能地域必须最少支持三个地域。...目前仅有部分大地域如北上广支持多可用区功能,其他暂时不开放地域随着腾讯机房建设,我们也会持续加入这个功能。...集群多可用区原理 数据节点 为了使多可用区功能生效,用户需要遵守以下原则: 购买集群数据节点个数为可用区个数倍数,例如选择两个可用区,那么数据节点个数应该为2、4、6、8...以此类推...[多可用区原理] 腾讯Elasticsearch会自动将用户所购买数据节点均匀部署在用户所选择可用区中,且所部署数据节点含有可用区感知功能。

    11.2K52532

    从VMware到腾讯备份恢复最佳实践

    配置平台 (腾讯) (1)左侧菜单栏点击 平台设置,在左侧点击选择 腾讯 选项 图片 2)按以下步骤填写信息,创建组件 该步骤会在认证完成后自动在腾讯认证租户下启动一台主机实例...,用以安装组件 接收容数据 按照如图所示,在添加目标平台时需要填写腾讯 Keystone认证信息,填写内容条目如下: 鉴权方式:默认为AK/SK Access Key ID:...访问腾讯 API 密钥,具有该账户完全权限,登录管理控制台→右上角个人信息→【访问管理】→【API密钥管理】 Access Key Secret:访问腾讯 API 密钥,具有该账户完全权限,...图片 选择主机启动时数据同步时间点(快照),并点击 确定 按钮,开始主机实例启动 提示 : 该动作会按照当前这台主机配置时设定参数,在平台腾讯上启动一台实例,即为主机...可以登录腾讯云云平台查看主机运行情况 图片 图片 【操作简单】 HyperBDR向导式操作界面设计,操作步骤跟随逻辑,帮助运维快速完成备份部署。

    2.3K70

    系列(一)—— 上业务方案要如何选?

    举个例子,某客户使用腾讯tdsql产品,当前是是单可用区部署,主从数据同步使用强同步;客户计划实现同地域不同AZ粒度。...典型案例 虽然这里对“”概念进行扩展,一般指同地域以及跨地域粒度;以上客户案例同时结合腾讯产品能力,分别对同城,异地备以及异地多活进行说明。...以下是上某个金融公司异地架构: 1)接入层和业务层均使用低配以及业务单台服务器部署方式,主要提升业务快速扩容能力,一方面主可用区异常,借助腾讯弹性伸缩AS能快速扩容,另一方面业务发布版本在不同地域保持一致...2)该数据层使用上PAAS产品,上产品均支持异地能力,同时操作便捷。如CDB和COS均通过上控制台按钮式方式建设异地能力;而对于es通过ccr方式进行数据复制。...以下是上某saas厂家同城双活案例: 存储业务均采用虚拟机或者黑石机器进行自建,业务以账户单双号进行set化部署;A区数据库存双号,B区数据库存双号;数据库同步使用双向方式;每个AZ数据库均存在全量数据

    8.7K116

    混合混沌演练

    但是在复杂混合环境中进行演练本身就比较复杂,涉及资源之多,进行混合演练门槛高。...腾讯混沌演练平台旨在协助用户便捷地进行上稳定性治理,平台结合行业经验,形成了混合演练行业经验,用户可以基于该演练经验一键创建混沌演练或在此模版基础上添加新故障演练场景,灵活便捷!...混合必要性混合结合了公有云和私有特点,因此在多云部署环境中,负载均衡、数据安全、服务安全稳定以及扩容伸缩等方面都将变得更加复杂。...混沌演练对混合价值体现腾讯混沌提供了对上资源类型CLB、CVM、专线、数据库等对象类型故障,通过混沌演练可以了解服务不可用时业务表现,检验故障告警有效性,同时也可以验证脱离公有后自身私有架构表现...如何快速进行混合混沌演练腾讯混沌演练工程结合行业经验,生成了一个混合演练经验模板,可通过该模板快速生成演练:前往腾讯混沌演练平台【概览】选择「混合演练」行业经验模版。

    16210

    主机安全建设

    (2)过度关注架构内因对可用性影响,忽略外部安全问题对可用性影响。 安全解决方案同业务解决方案区别: (1)业务解决方案倾向业务架构内因解决问题。...业务问题发生普遍原因是基于业务访问量,架构负载,业务逻辑等内部可用性层面导致,解决思路多以异地备,混合多活备, 数据迁移同步等层面解决。 (2)安全解决方案倾向安全行为外因解决问题。...安全问题普遍原因是基于外部安全攻击行为导致,解决思路多以数据备,主机备,安全防御,安全检测等思路解决。 安全根本目的是:保障业务连续性。 不能片面地为了“安全”而安全。...服务于 CIA全过程 五.主机安全解决方案 1.第一步:快照备份,全盘快照 (1)创建上定期快照:https://cloud.tencent.com/document/product/362/...2.第二步:上防御,选择混合架构勒索防御安全产品 (1)腾讯 腾讯主机安全混合解决方案:https://v2.s.tencent.com/activity/news/70 image.png (

    2.6K92

    客户案例—zookeeper迁移方案

    3台不停止服务最低限度是2台(X/2+1),而5台最低限度是3台。 我们应该保证,集群中最低有3台ZooKeeper是启动。...此外,重启时应保证先重启myid最小机器,由小向大进行重启 Leader无论其myid大小,都放到最后重启 因为ZooKeeper机制中,myid大会向小发起连接,而小不会向大发起连接。.../conf/zoo.cfgMode: follower 将其扩容为5节点ZooKeeper 先查看原先ZooKeeper集群情况 echo mntr|nc localhost 2181 这条4字命令可以查看集群情况...STOPPED 查看新Leader ZooKeeper会尽可能选择myid最大机器为Leader,因此原本idc02-kafka-ds-04其myid为5变为了Leader 12345 [hadoop...然后只要将现在5台再缩小到3台且不包括原本myid为1-2机器,就完成了迁移 将5台缩小回3台 修改idc02-kafka-ds-02 根据前面的注意事项,我们此时5台集群中启动数量不得少于3台,

    1.7K51

    系列(六)——数据存储建设

    数据存储建设主要从数据可靠性和业务稳定性两个维度阐述。这两者有哪些区别呢?...企业通常使用数据存储产品主要为硬盘(CBS)以及对象存储(CFS)。...1.数据可靠性 1.1 硬盘(CBS) 硬盘采用三副本分布式机制,系统确认数据在三个副本中都完成写入后才会返回写入成功响应。...1.2 对象存储(COS) COS将数据分散存储在城市中多个不同数据中心,其中某数据中心故障了,多AZ存储架构依然可以为上客户提供稳定可靠数据服务,上数据可靠性是12个9,即99.9999999999%...列举一下几个场景: 场景一: CBS快照跨地域能力建设 当前平台CBS数据可靠性能力在地域粒度,对于公司核心数据要求多地域备份时,需要业务通过调用API来实现;高可用能力建设核心思路: 1.定期快照复制新

    3.4K73

    腾讯跨可用区备份解决方案详解

    图片腾讯跨可用区备份解决方案腾讯利用可用区为企业提供高可用性跨可用区备份解决方案,腾讯通过将应用程序和数据部署到不同可用区,可以实现多重冗余和容错,从而提高系统可用性和可靠性。...腾讯跨可用区备份是完全基于腾讯备份解决方案,因此要求备份工具与腾讯具有高度适配性,充分发挥腾讯优势,实现高度自动化、普惠腾讯。...然而,目前市面上少有能与腾讯紧密结合工具。HyperBDR原生业务级别工具。...目前已与腾讯完成深度API对接,支持高度自动化腾讯。...Boot in Cloud技术HyperBDR深度对接腾讯平台API接口,充分利用腾讯平台几十个接口实现上资源创建,读取,管理和编排,快速构建和部署基于腾讯备应用,实现真正腾讯原生

    1.8K20

    腾讯COS对象存储占据数据C位

    说到公有,大家首先想到上数据备份。 然而,随着企业核心业务逐渐从线下迁移到上,客户提出了更高要求。如何确保上业务高可用、数据高可靠,这对厂商提出了新挑战。...2.png 在这篇文章中,我们聚焦在数据层,介绍一下腾讯COS对象存储解决方案。 一、Region 和 AZ 概念 首先介绍一下 Region 和 AZ 概念。...二、跨可用区 如果您应用程序已经构建在腾讯上,可以借助 COS 对象存储多 AZ(Available Zone)来提高数据层可用性。...多 AZ(Available Zone)是指由腾讯对象存储推出多 AZ 存储架构,这一存储架构能够为用户数据提供数据中心级别的能力。...七、写到最后 无论您业务已经构建在腾讯上或者正在准备迁移上,都可以借助 COS 对象存储提供能力来保护您业务数据。通过多 AZ、跨区域复制、版本控制等功能,实现数据冗余存储。

    3.5K61

    系列(二)—— 企业借助平台“一站式”建设?

    随着业务对持续性要求越来越高,上不少企业对跨AZ或多地域建设有强烈诉求。...本文也平台能力建设优势、典型方案以及一站式构建三个方面来进行详细说明。 1.平台建设优势 借助平台能力有效提升建设效率,同时能减少建设成本。 1)降低建设技术门槛。...上核心产品拥有跨地域或者跨可用区能力,减少企业对众多开源方案依赖和研究,同时还能得到产品SLA稳定性保障。 2)组件HA切换能力建设。...以腾讯为例,构建同城双活数据库单写整体业务部署架构: image.png 2.2 异地备 异地主要满足客户数据安全需求。...以腾讯为例,构建异地备整体架构: image.png 3.一站式构建能力 关于能力概况,以腾讯为例如下: 产品 多可用区实例 多地域实例 CLB 1.控制台支持购买多可用区实例。

    4.1K42

    腾讯 TDMQ for Apache Pulsar 多地区高可用实践

    本文将从四个维度,深入剖析 Pulsar 在多可用区高可用领域策略。...有多年开发和维护经验,目前在腾讯从事 TDMQ for Apache Pulsar 商业化产品方向研发工作。...因为我们用腾讯,所以 ZooKeeper 部分就直接用了服务,省去了自己维护麻烦。而 BK 和 Broker 部分,则是由我们自己来管理和维护。...所以实际上我们有状态服务,要考虑就是存储和网络该怎么弹性去做插拔,为了实现这一点,我们利用腾讯能力,采用盘作为存储,弹性网卡提供网络服务。...这包括集群扩容、缩、新集群创建或配置升级。 流程前几个步骤,如确定规格和渲染配置,与服务常规发货流程相似。但关键环节是我们部署流程,特别是针对 Pulsar 集群部署。

    19510

    腾讯 TDMQ for Apache Pulsar 多地区高可用实践

    本文将从四个维度,深入剖析 Pulsar 在多可用区高可用领域策略。...01、整体架构 腾讯 TDMQ for Apache Pulsar(简称 TDMQ Pulsar 版)是基于 Apache Pulsar 开发一款金融级商业化消息中间件。...因为我们用腾讯,所以 ZooKeeper 部分就直接用了服务,省去了自己维护麻烦。而 BK 和 Broker 部分,则是由我们自己来管理和维护。...所以实际上我们有状态服务,要考虑就是存储和网络该怎么弹性去做插拔,为了实现这一点,我们利用腾讯能力,采用盘作为存储,弹性网卡提供网络服务。...2.1 变更流程 变更流程是我们在原生和容器场景下,进行集群变更标准化过程。这包括集群扩容、缩、新集群创建或配置升级。 流程前几个步骤,如确定规格和渲染配置,与服务常规发货流程相似。

    26310

    如何利用腾讯解决方案替代备一体机

    二、优势现在,在计算市场逐步扩大背景下,成为新选择。从技术角度来看,基于数据复制技术,结合原生资源特性,利用上编排能力,满足数据安全性和业务连续性。...三、利用HyperBDR构建腾讯方案这里推荐用万博智HyperBDR工具,低成本构建腾讯方案。为了攻克资源冗余问题,HyperBDR在思路上有一个革新。...架构如下:3.3腾讯具体实现这里以10台VMware虚拟机,两套业务系统,腾讯为例。基础条件:(1)需要主机:10台。(2)根据主机数量1:1购买license:10个。...(3)有腾讯资源,有腾讯平台管理权限。3.3.1 配置生产平台 (VMware)第一步:点击菜单栏 生产平台设置,点击 VMware 选择框。...在界面可以看到 待VMware主机清单,勾选要操作主机,点击 下一步 按钮,进入 配置 操作。3.3.2配置平台(1)左侧菜单栏点击 平台设置,在左侧点击选择腾讯选项。

    1.4K00
    领券