一、简介
有这么一种说法,自然界中并不存在两片完全一样的雪花的。每一片雪花都拥有自己漂亮独特的形状、独一无二。雪花算法也表示生成的ID如雪花般独一无二。
雪花算法 (SnowFlake )算法,是 Twitter 开源的分布式 id 生成算法。
其核心思想是:使用一个 64 bit 的 long 型的数字作为全局唯一 id。在分布式系统中的应用十分广泛,且ID 引入了时间戳,基本上保持自增的。
这 64 个 bit 中,其中 1 个 bit 是不用的(我们生成的 id 都是正数,所以第一个 bit 统一都是 0),然后用其中的 41 bit 作为毫秒数,用 10 bit 作为工作机器 id,12 bit 作为序列号。

第一个部分,是 1 个 bit:0,这个是无意义的。
第二个部分是 41 个 bit:表示的是时间戳。
第三个部分是 5 个 bit:表示的是机房 id,10001。
第四个部分是 5 个 bit:表示的是机器 id,1 1001。
第五个部分是 12 个 bit:表示的序号,就是某个机房某台机器上这一毫秒内同时生成的 id 的序号,0000 00000000。
①1 bit:是不用的,为啥呢?
因为二进制里第一个 bit 为如果是 1,那么都是负数,但是我们生成的 id 都是正数,所以第一个 bit 统一都是 0。
②41 bit:表示的是时间戳,单位是毫秒。
41 bit 可以表示的数字多达 2^41 - 1,也就是可以标识 2 ^ 41 - 1 个毫秒值,换算成年就是表示 69 年的时间。
③10 bit:记录工作机器 id,代表的是这个服务最多可以部署在 2^10 台机器上,也就是 1024 台机器。
但是 10 bit 里 5 个 bit 代表机房 id,5 个 bit 代表机器 id。意思就是最多代表 2 ^ 5 个机房(32 个机房),每个机房里可以代表 2 ^ 5 个机器(32 台机器),也可以根据自己公司的实际情况确定。
④12 bit:这个是用来记录同一个毫秒内产生的不同 id。
12 bit 可以代表的最大正整数是 2 ^ 12 - 1 = 4096,也就是说可以用这个 12 bit 代表的数字来区分同一个毫秒内的 4096 个不同的 id。
二、算法优缺点
雪花算法的优点:
(1)无依赖:不依赖第三方库或者中间件,完全在内存中生成,可用性强。
(2)高性能:每秒中能生成数百万的自增ID。
(3)ID自增:基于时间戳,以及同一时间戳下序列号自增,基本保证 id 有序递增。
雪花算法的缺点:
依赖与系统时间的一致性,如果系统时间被回调,或者改变,可能会造成id冲突或者重复。算法中可通过记录最后一个生成 id 时的时间戳来解决,每次生成 id 之前比较当前服务器时钟是否被回拨,避免生成重复 id。
三、算法实现
工具类代码:
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import java.lang.management.ManagementFactory;
import java.net.InetAddress;
import java.net.NetworkInterface;
public class IdWorker {
private static final Logger LOGGER = LoggerFactory.getLogger(IdWorker .class);
private final static String ERROR_CLOCK_BACK = "时间回拨,拒绝为超出%d毫秒生成ID";
private final static String ERROR_ATTR_LIMIT = "%s属性的范围为0-%d";
/**
* 用于用当前时间戳减去这个时间戳,算出偏移量
*/
protected static final long TWEPOCH = 1538211907857L;
/**
* 机器id所占的位数(表示只允许workId的范围为:0-1023)
*/
protected static final long WORKER_ID_BITS = 5L;
/**
* 数据标识id所占的位数
*/
protected static final long DATACENTER_ID_BITS = 5L;
/**
* 支持的最大机器id,结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数)
*/
private static final long MAX_WORKER_ID = ~(-1L << WORKER_ID_BITS);
/**
* 支持的最大数据标识id,结果是31
*/
private static final long MAX_DATACENTER_ID =

最低0.47元/天 解锁文章
426

被折叠的 条评论
为什么被折叠?



