当前位置：首页 > news >正文

分布式缓存———数据一致性问题

news 2026/2/16 8:46:03

分布式基础理论

CAP理论与 BASE理论-CSDN博客

分布式系统会的三座大山：NPC。

N：Network Delay，网络延迟
P：Process Pause，进程暂停（GC）
C：Clock Drift，时钟漂移

在当前主流k8s服务部署的一个service通常存在多个pod。多个pod对数据进行读写操作经常会出现数据不一致性的问题。不一致的问题主要是在数据库发生数据变更后，多个pod高并行读取数据受到网络，gc等问题可能导致缓存里的数据是旧值

影响分布式缓存数据一致性大致有以下几类问题：

获取数据时候网络延迟N
各个pod内部gc的触发不一致C
数据库主从，读写分离的问题

多个pod对同一份数据并行操作，受到N,C的影响。导致对同一个key缓存的操作，缓存更新后还是旧版本数据，从而对我们业务造成影响。

为什么使用缓存

使用缓存我们一般为了提高我们的系统性能，减少数据库的压力。如果我们追求强一致性，强一致性方案往往会严重的影响性能，常见2pc，3pc方案。

强一致性：读 DB 优先，主要依赖数据库的强一致性，缓存仅作为“DB 降压”的辅助手段。看到有一种方案在cache side业务模型中，通过setnx来实现分布式缓存互斥，缓存过期时间设置非常短达到降压效果。查db的时候,db性能受到影响，我们通过主从读写分离，分库分表来提高查询性能。有时候根据业务比如基金业务，基金最新数据我们可以通过分表，表里通过基金唯一索引，数据一直更新的操作，这样这张表一直是小表的查询。

最终一致性：基于base理论，当数据库数据发生数据变更的时候，读取缓存。中间态的数据会返回给业务，所以我们在做分布式与数据库一致性的时候。往往是要减少中间软状态，通过先更新数据库删除缓存或者先更新数据库后更新缓存加重试的方案。及时让数据达到最终一致性的状态