分布式缓存的选择和问题
如今,缓存系统的应用非常广泛,能够用来提高并发数、数据吞吐量,提高快速响应能力。那么当数据量达到一定程序,单机环境可能就显得有些力不从心了,就需要一个分布式缓存系统。
图1-1
如上图所示,首先缓存大致可以分为四大类。
本文主要探讨各分布式缓存系统,如下图所示,列出了五种:
之后对MemCache、Tair、Redis做出对比
其中EvCache
和Aerospike
使用场景不是那么通用和广泛。
除此之外,还有三种常见缓存系统。
综上所述,在一般情况下,考虑到适用性和稳定性,Redis 是搭建缓存系统的最优选择。以下将基于 Redis 介绍。
如顶部图所示,列出了Redis的集群高可用的方案,基本可以分为三种。
常见的集群的架构,搭建简单,主要实现读写分离和备份,可以由 Master 负责读写,Slave 负责备份。但存在故障恢复复杂、水平拓展难、写能力受限等问题。结构图如下:
Redis Sentinel 是社区版本推出的原生高可用解决方案。由一或多个哨兵实例监视任意个主从服务器,且在 Master 宕机时,自动将宕机服务器属下的 Slave 服务器升级为 主服务器,从而保证系统的可用性。较主从实现的监控、选主。但问题主要是要保证Master的HA切换。结构图如下:
到这里其实以上两种机制其实只能算作“集群”,并非严格意义上的“分布式”。接着来看看分布式方案。
“集群强调高可用,分布式又强调协作。
任何分布式存储系统,首先面临的就是 sharding(分片)问题,如顶部图1-1所示可分为三种方式。
顾名思义,将数据分片的路由功能交给客户端,但这是一种静态分片,维护性差。基本而言是不予考虑的。
通过代理分发到具体的redis实例。有两个常用解决方案。- Twemproxy Twitter开源,轻量级,但不再维护,也无法平滑地扩容/缩容,运维也不是很友好,性能一般。- Codis 豌豆荚开源,支持水平拓展,运维平台完善,性能较 Twemproxy 快。Codis在国内使用较多,同时代理分片的思路也有很多公司在此基础开发了自己的二次方案。不过Codis也不再维护。
其实,这两种代理分片的方案,都是在 Redis 官方未推出良好的分布式方案时的策略,在官方更新后都不再维护。
这就要谈到 Redis 官方的方案 Redis-cluster 。
在 Redis3.0 之前是没有较好的分布式方案的,这也是第三方方案出现的原因。3.0 开始,官方推出了去中心化的分布式方案。集群中包含16384个散列槽,每个节点负责其中一部分。
先看下拓扑图:
每个节点打开两个TCP连接,一个负责给客户端提供服务,一个负责节点间通信。
此刻要说说 CAP了 :Consistency(一致性)、Availability(可用性)、Partition tolerance(分区容错性) 。对分布式系统而言,CAP 必须牺牲一者。Redis Cluster 的设计目标主要是高性能、高可用和高扩展, 只好抛弃一部分数据一致性.
multiple key
操作时需要keys
位于同一个slot
上,需要使用hash tags
,使用{}
强制将某些key映射到每个slot,以便进行multiple
。以上介绍了简单介绍了常见缓存系统,并具体列出了基于Redis的集群方案。下面谈一谈缓存系统常见的问题。
如下图所示,列出七个常见问题。
指访问不存在的数据,从而绕过缓存,直接请求到了数据源,当请求过多,就会对 DB 造成压力。
缓存击穿实际是缓存雪崩的一个特例。指当某些热点key过期时,就会有大量的请求击穿到DB。
同一时刻大量缓存失效(故障), 请求到了DB。
主从
缓存,从key
不过期。如果保证数据一致性。列出四种更新策略:
对于热点数据的处理方法。
指可以将某些的缓存数据提前加载到缓存系统。提前避免在如热点数据大量请求到库。
指当访问量剧增、服务出现问题或非核心服务影响到核心流程的性能时,仍需保证主服务可用。可根据一些关键数据自动降级,也可配置开关人工降级。
对于Redis Cluster环境的搭建和基础使用非常简单。
无论基于何种方式,只要搭建好n台 redis 服务并保证各服务间可以互相通讯后,任意进入一个redis 服务键入:
redis-cli --cluster create IP1:port1 IP2:port2 IP3:port3 IP4:port4 IP5:port5 IP6:port6 ... --cluster-replicas 1
即可。之后可以使用 cluster node
和cluster info
查看集群、节点信息。
而对于广大 JAVA 服务器端开发,Spring Data Redis 从1.7起即支持Redis Cluster,只需配置Master节点地址(和密码)。
spring.redis.cluster.nodes=ip1:port1,ip2:port2,ip3:port3
加入依赖
compile("org.springframework.boot:spring-boot-starter-data-redis")
即可通过 RedisTemplate 使用。
本文从缓存系统的选择出发,基于 Redis 介绍了几种集群方案并重点说明了 Redis Cluster 方案。之后列出缓存系统常见问题及常见解决方案,最后对使用做了简单说明。
当然,如何去落地,如何解决这些问题还需要根据实际场景具体分析和处理。