一致性哈希算法

想象一下，我们有三台缓存服务器（编号0、1、2），需要存储3万个文件。如何让这些文件均匀分布，既能让每台服务器分摊压力，又能快速找到需要的文件呢？

传统方法的困境 @

最初的做法很直接：对文件标识（如“文件名+创建时间”）进行哈希计算，然后对服务器数量取模：

hash(文件标识) % N

这样就能确定文件应该存放在哪台服务器上。查找时重复这个计算，直奔目标服务器即可。

但这种简单方法有两个致命缺陷：

一致性哈希算法通过一个精妙的环形结构解决了上述问题。

算法将整个哈希值空间组织成一个虚拟的圆环，范围是0到2^32-1，就像钟表一样首尾相接。

工作流程如下：

当服务器数量变化时，只有部分缓存会受到影响。比如服务器B下线，原本属于B的文件会顺延给服务器C，而属于A的文件完全不受影响。这种渐进式的调整避免了系统被瞬间压垮的风险。

理想很丰满，现实可能很骨感。在实际应用中，我们可能会遇到这样的尴尬情况：

从图中可以看到，服务器A承载了大部分文件（1、2、3、4、6号），服务器B只缓存了5号文件，而服务器C竟然完全没有缓存！这种“旱的旱死，涝的涝死”的现象就是哈希环偏斜。

偏斜带来的后果：

为了解决偏斜问题，工程师们想出了“虚拟节点”这个巧妙的办法。

核心思想：为每个物理服务器创建多个“分身”，让这些虚拟节点均匀分布在哈希环上。

通过引入虚拟节点：

一致性哈希算法通过环形结构和虚拟节点技术，巧妙地解决了分布式缓存中的关键问题：

这种设计让分布式系统像精密的齿轮组一样，即使个别部件需要调整，整个机器仍能平稳运行，为我们构建高可用的互联网服务提供了坚实的技术基础。