负载均衡 CLB 的高可用是从系统架构、产品配置等多维度来保障的。您可以根据业务场景和需求,选择跨地域容灾、同地域跨可用区容灾等多种功能方案。
CLB 集群高可用
负载均衡CLB实例采用集群部署,支持会话同步,消除服务器单点,提升系统冗余,保证服务稳定。所有CLB实例均具备集群高可用。
四层主要基于腾讯自研的统一接入网关(Tencent Gateway,TGW)来实现负载均衡,TGW 具有可靠性高、扩展性强、性能高、抗攻击能力强等特点,支持 Data Plane Development Kit(DPDK)高性能转发,单集群可支持亿级并发、千万级 PPS。腾讯内部诸多业务均通过 TGW 接入服务,包括腾讯游戏、腾讯视频、微信、QQ 等。
七层主要基于 Secure Tencent Gateway(STGW)实现负载均衡,STGW 是腾讯基于 Nginx 自研的支持大规模并发的七层负载均衡服务,承载了腾讯内大量的七层业务流量。
单 CLB 实例高可用
非域名化公网 CLB
非域名化的公网 CLB 以 VIP 形式提供服务,SLA 为99.95%,VIP 所属集群有2种部署方案:
部署模式 | 集群容灾 | 跨可用区容灾 |
单可用区 | 支持 | 不支持 |
多可用区 | 支持 | 支持,主备可用区模式,当主可用区故障时,负载均衡可在非常短的时间内(约30s)自动切换到备可用区并恢复服务 |
域名化公网 CLB
“域名化公网 CLB”在上述“非域名化公网 CLB”的基础上,增加一层 DNS 服务,SLA 从99.95%提升至99.99%,可自动替换故障 VIP,提高可用性。详情请参见 域名化公网负载均衡上线公告。
内网 CLB
内网 CLB 采用就近接入架构部署,同一个 CLB 实例会下发到一个或多个可用区,客户端访问该 CLB 时,访问流量会自动选择延时最低的可用区集群,然后转发到后端服务器。
内网 CLB 暂不具备跨可用区容灾切换的能力,如果某个可用区的 CLB 集群不可用,会影响来自该可用区访问源的访问,若访问源为其他可用区且对应可用区有就近接入,则流量不受影响;若访问源为其他可用区,对应可用区无就近接入,且默认指向故障 CLB,则流量受影响。
多 CLB 实例高可用
如果您对可用性要求非常高,CLB 实例自身的可用性保障机制可能无法满足您的需求,如网络攻击、跨地域切换、配置有误等场景。您可以创建多个 CLB 实例,通过云解析 DNS 对访问流量进行调度。
多 CLB 实例高可用与域名化公网 CLB 对比:
对比项 | 域名化公网 CLB | 多 CLB 实例高可用 |
SLA | 99.99% | 99.95% |
容灾切换 | 提供链路检测和容灾切换的能力,无需担心单 IP 入口中断问题。当单 IP 发生故障时,可自动切换故障 IP,降低业务影响。 | 依赖您配置的 DNS 解析及切换策略,需业务及时发现及切换。 |
运维管理 | 仅需配置单实例。 | 需配置多个 CLB 实例和对应的 DNS 解析策略。 |
成本 | 成本较低,仅收取CLB相关费用。 | 需部署多个 CLB 实例和 DNS 解析等组件,成本更高。 |
地域 | CLB 实例所属集群部署在单地域。 | 可选择多地域的 CLB 实例。 |
最佳实践:
若您的业务是单地域部署,建议优先选择域名化公网 CLB 方案,自动切换故障 IP;
若您的业务是多地域部署,且对容灾需求非常高,建议选择多 CLB 实例高可用方案。
同一个客户端在同一时刻,通过不同的中间节点访问同一个后端服务器的同一个端口可能会出现串流现象,详情请参见 串流问题说明。
后端服务高可用
负载均衡 CLB 通过健康检查来判断后端服务的可用性,避免后端服务异常影响前端业务,从而提高业务整体可用性。
开启健康检查后,无论后端服务器权重是多少(包括权重为0),负载均衡实例都会进行健康检查。您可在实例列表页面的健康状态列查看健康检查状态,或者在监听器的绑定后端服务详情页面查看健康检查状态。关于健康检查的详细机制,请参见 健康检查概述。