当前位置：首页 > news >正文

实用指南：缓存高可用架构-读缓存

news 2026/3/27 2:10:37

业务场景

如何将十几秒的查询请求优化成毫秒级

缓存中间件技术选型

目前比较流行的缓存中间件Memcached、MongoDB、Redis进行简单对比

使用MongoDB的最少，因为它只是一个数据库，由于它的读写速度与其他数据库相比更快，人们才把它当作类似缓存的存储。

因此接下来就是比较Redis和Memcached，并从中做出选择。目前，Redis比Memcached更流行，这里总结一下原因，共3点。

（1）数据结构举个例子，在使用Memcached保存List缓存对象的过程中，如果往List中增加一条数据，则起初需要读取整个List，再反序列化塞入数据，接着再序列化存储回Memcached。而对于Redis而言，这仅仅是一个Redis请求，它会直接帮助塞入数据并存储，简便快捷。

（2）持久化对于Memcached来说，一旦系统宕机数据就会丢失。因为Memcached的设计初衷就是一个纯内存缓存。借助Memcached的官方文档得知，1.5.18版本以后的Memcached协助Restartable Cache（可重启缓存），其实现原理是重启时CLI先发信号给守护进程，然后守护进程将内存持久化至一个材料中，架构重启时再从那种文件中恢复数据。不过，这个设计仅在正常重启情况下使用，意外情况还是不处理。而Redis是有持久化功能的。

（3）集群这点尤为重要。Memcached的集群设计非常简单，客户端根据Hash值直接判断存取的Memcached节点。而Redis的集群因在高可用、主从、冗余、Failover等方面都有所考虑，所以集群设计相对复杂些，属于较常规的分布式高可用架构。因此，经过一番慎重的思考，项目组最终决定使用Redis作为缓存的中间件。技术选型做完后，开始考虑缓存的一些具体问题，先从缓存何时存储数据入手。

缓存何时存储素材

使用缓存的逻辑如下：

1）先尝试从缓存中读取数据。

2）若缓存中没有资料或者数据过期，再从数据库中读取数据保存到缓存中。

3）最终把缓存数据返回给调用方。

这种逻辑唯一麻烦的地方是，当用户发来大量的并发请求时，它们会发现缓存中没有数据，那么所有请求会同时挤在第2）步，此时如果这些请求全部从数据库读取数据，就会让数据库崩溃。

数据库的崩溃行分为3种情况。

1）单一数据过期或者不存在，此种情况称为缓存击穿。

解决方案：第一个线程如果发现Key不存在，就先给Key加锁，再从数据库读取数据保存到缓存中，最终释放锁。如果其他线程正在读取同一个Key值，那么必须等到锁释放后才行。关于锁的问题前面已经讲过，此处不再赘述。

2）数据大面积过期或者Redis宕机，这种情况称为缓存雪崩。

解决方案：设置缓存的过期时间为随机分布或设置永不过期即可。

3）一个恶意请求获取的Key不在数据库中，此种情况称为缓存穿透。

比如正常的商品ID是从100000到1000000（10万到100万之间的数值），那么恶意请求就可能会故意请求2000000以上的数据。这种情况如果不做处理，恶意请求每次进来时，肯定会发现缓存中没有值，那么每次都会查询数据库，虽然最终也没在数据库中找到商品，但是无疑给数据库增加了负担。

这里给出两种解决办法：

①在业务逻辑中直接校验，在数据库不被访问的前提下过滤掉不存在的Key。

②针对恶意请求的Key存放一个空值在缓存中，防止恶意请求骚扰数据库。

缓存预热

上面这些逻辑都是在确保查询材料的请求已经过来后如何适当地处理，如果缓存数据找不到，再去数据库查询，最终是要占用服务器额外资源的。那么最理想的就是在用户请求过来之前把数据都缓存到Redis中。这就是缓存预热。其具体做法就是在深夜无人访问或访问量小的时候，将预热的数据保存到缓存中，这样流量大的时候，用户查询就无须再从数据库读取数据了，将大大减小数据读取压力。