Snowflake雪花算法

最新推荐文章于 2025-08-27 00:29:25 发布

原创

最新推荐文章于 2025-08-27 00:29:25 发布 · 443 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#1024程序员节 #雪花算法 #Snowflake #分布式ID

本文介绍了分布式ID及雪花算法。随着业务扩展，传统ID生成方式无法满足需求，雪花算法应运而生。它由Twitter开源，生成的ID由64位二进制组成，分四部分。文中还给出Java实现及常见问题解答，该算法能解决分布式架构下ID唯一性等问题。

文章目录

分布式ID
一、雪花算法起源
二、雪花算法的原理
三、java实现雪花算法
四、常见问题
总结

分布式ID

分布式ID，也称为全局唯一ID，是在分布式系统中用于标识数据的唯一标识符。随着业务量的不断扩展，传统的UUID和数据库自增ID无法满足需求，需要进行分库分表，而分表后，每个表中的数据都会按自己的节奏进行自增，很有可能出现ID冲突。此时就需要一个单独的机制来负责生成唯一ID，生成出来的ID也可以叫做分布式ID，或全局ID。这个ID应满足全局唯一性、高性能和趋势递增等要求。

一、雪花算法起源

Snowflake中文的意思是“雪花”（因为在大自然中，不可能存在两片一模一样的雪花），所以被翻译成雪花算法。它最早是twitter内部使用的分布式环境下的唯一ID生成算法，在2014年开源。

二、雪花算法的原理

Snowflake产生的ID由 64 bit 的二进制数字组成，被分成了4个部分，每一部分存储的数据都有特定的含义：

> 第 0 位： 符号位（标识正负），始终为 0； 
> 第 1~41 位 ：一共 41 位，用来表示时间戳，单位是毫秒，可以支撑2 ^41 毫秒（约 69 年）2^41/1000*60*60*24*365 = 69年 
> 第 42~52 位 ：一共 10 位，工作机器id，一般用前 5 位表示机房ID，后 5 位表示机器ID，用于区分不同集群/机房的节点，10位的长度，可以表示1024个不同节点。 
> 第 53~64 位 ：一共12 位，用来表示序列号。 序列号为自增值，代表单台机器每毫秒能够产生的最大ID 数(2^12 =4096)，也就是说单台机器每毫秒最多可以生成 4096 个 唯一 ID，最大可以支持400w左右的并发量。

具体结构如下：
在这里插入图片描述

三、java实现雪花算法

package snow;

/**
 * @author 杨树林
 * @version 1.0
 * @since 24/10/2023
 */

public class SnowFlake {
   
   
    // 机房(数据中心)ID
    private long datacenterId;

    // 机器ID
    private long workerId;

    // 同一时间的序列号
    private long sequence;

    // 开始时间戳
    private long twepoch = 1634393012000L;

    // 机房ID所占的位数： 5个bit
    private long datacenterIdBits = 5L;

    // 机器ID所占的位数：5个bit
    private long workerIdBits = 5L;

    // 最大机器ID：5bit最多只能有31个数字，就是说机器id最多只能是32以内
    // 最大:11111(2进制) --> 31(10进制)
    private