Twitter的雪花算法SnowFlake原版及改进版全解析
Twitter的雪花算法SnowFlake原版
package com.wheel.eden.common.util.core;
/**
* Twitter 的 Snowflake 算法
* 分布式系统中, 有一些需要使用全局唯一ID的场景, 有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。
* <p>
* snowflake 的结构如下(每部分用-分开):
* 符号位(1bit)- 时间戳相对值(41bit)- 数据中心标志(5bit)- 机器标志(5bit)- 递增序号(12bit)
* 0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000
* <p>
* 1位标识, 由于long基本类型在Java中是带符号的, 最高位是符号位, 正数是0, 负数是1,id一般是正数,所以最高位是0
* 41位毫秒级时间截, 存储时间截的差值(当前时间截 - 开始时间截) ,可以使用69年 (年T = (1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69)
* 10位数据机器位, 可以部署在1024个节点, 包括5位dataCenterId和5位workerId
* 12位序列, 毫秒内的计数, 支持每个节点每毫秒产生4096个ID序号
* <p>
* SnowFlake 共计64位分布式ID, 正好是一个Long型, 且可根据ID反推出 createTime , dataCenterId , workerId 等信息
* SnowFlake 整体上按照时间自增排序, 分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作区分), 每秒能够产生26万ID左右
* <p>
* 雪花算法改进版, 参考:
* https://blog.youkuaiyun.com/u010541670/article/details/119775492
* 自动生成数据中心ID和机器ID算法, 参考:
* https://blog.youkuaiyun.com/u010541670/article/details/119774545
*
* @author 白纸涂鸦
* @date 2021/7/28
* @since 1.0.0
*/
public class TwitterSnowflake {
// ================================ Default ============================================
/** 基准开始时间截 (2021-01-01) 一旦确定不能变动 */
private final static long EPOCH = 1609430400000L;
/** 0L **/
private final static long MIN_POSITIVE_LONG = 0L;
/**
* 每一部分占用的位数
*/
private final static long CENTER_ID_BITS = 5L;
private final static long WORKER_ID_BITS = 5L;
private final static long SEQUENCE_BITS = 12L;
/**
* 每一部分的最大值
*/
private final static long MAX_WORKER_ID = ~(-1L << WORKER_ID_BITS);
private final static long MAX_CENTER_ID = ~(-1L << CENTER_ID_BITS);
private final static long MAX_SEQUENCE = ~(-1L << SEQUENCE_BITS);
/** 序列ID的掩码, 2^12 -1 = 4095 */
private final static long SEQUENCE_MASK = ~(-1L << SEQUENCE_BITS);
/** 机器ID向左移12位 **/
private final static long WORKER_ID_SHIFT = SEQUENCE_BITS;
/** 数据中心ID向左移17位(12+5) **/
private final static long CENTER_ID_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS;
/** 时间截向左移22位(5+5+12) **/
private final static long TIMESTAMP_LEFT_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS + CENTER_ID_BITS;
// ================================ Fields ==============================================
/** 数据中心ID (0~31) **/
private final long centerId;
/** 机器ID (0~31) **/
private final long workerId;
/** 序列ID (0~4095) **/
private long sequence = 0L;
/** 上次生成ID的时间截 **/
private long lastTimestamp = -1L;
// ================================ Constructors ========================================
public TwitterSnowflake(long workerId, long centerId) {
if (workerId <= MAX_WORKER_ID && workerId >= MIN_POSITIVE_LONG) {
if (centerId <= MAX_CENTER_ID && centerId >= MIN_POSITIVE_LONG) {
this.workerId = workerId;
this.centerId = centerId;
} else {
throw new IllegalArgumentException(StrUtil.format("dataCenter Id can't be greater than {} or less than 0", MAX_CENTER_ID));
}
} else {
throw new IllegalArgumentException(StrUtil.format("worker Id can't be greater than {} or less than 0", MAX_WORKER_ID));
}
}
// ================================ Methods ============================================
/**
* 获得下一个分布式ID (该方法是线程安全的)
*
* @return snowflakeId
*/
public synchronized long nextId() {
// 当前时间戳
long timestamp = genTime();
// 如果当前时间戳小于上一次ID生成的时间戳,说明系统时钟回退过这个时候应当抛出异常
if (timestamp < lastTimestamp) {
throw new IllegalStateException(StrUtil.format("Clock moved backwards. Refusing to generate id for {}ms", this.lastTimestamp - timestamp));
}
// 同一毫秒内进行序列自增
if (timestamp == lastTimestamp) {
sequence = (sequence + 1L) & SEQUENCE_MASK;
// 同一毫秒的序列数已经达到最大
if (sequence == 0L) {
timestamp = tilNextMillis(lastTimestamp);
}
} else {
// 不同毫秒内,序列号置为0
sequence = 0L;
}
// 重置最后生成ID的时间戳
lastTimestamp = timestamp;
// 时间戳部分 | 数据中心部分 | 机器标识部分 | 序列号部分
return (timestamp - EPOCH) << TIMESTAMP_LEFT_SHIFT | centerId << CENTER_ID_SHIFT | workerId << WORKER_ID_SHIFT | this.sequence;
}
/**
* 阻塞到下一个毫秒,直到获得新的时间戳
*
* @param lastTimestamp 上次生成ID的时间截
* @return 当前时间戳
*/
private long tilNextMillis(long lastTimestamp) {
long timestamp = genTime();
while (timestamp <= lastTimestamp) {
timestamp = genTime();
}
return timestamp;
}
/**
* 返回当前毫秒时间戳
*
* @return 当前毫秒时间戳
*/
private long genTime() {
return System.currentTimeMillis();
}
}
Twitter的雪花算法SnowFlake改进版
1、闰秒兼容改进
https://blog.youkuaiyun.com/u010541670/article/details/119774545
2、时钟回拨兼容改进
https://blog.youkuaiyun.com/wengengeng/article/details/106007879
3、位数改进
https://blog.youkuaiyun.com/ciap37959/article/details/100619920
4、自动获取 datacenterId 和 workerId 改进
https://blog.youkuaiyun.com/u010541670/article/details/119774545