深度解析:大型互联网公司分布式ID方案总结与实践
mhr18 2024-10-09 12:21 19 浏览 0 评论
在现代互联网架构中,不同服务分布在多个节点上进行协作是常态。为了确保各个节点生成的数据能够唯一且高效地进行标识,一个稳定的分布式ID生成方案至关重要。这篇文章将总结大型互联网公司在分布式ID生成方面的经验和实践,深入解析几种常见的分布式ID方案,帮助你选择并实现最合适的方案。
目录
- 背景介绍
- 单点ID生成器
- 数据库自增序列
- 基于Redis的ID生成方案
- ZooKeeper分布式锁
- Twitter Snowflake
- 百度 UID Generator
- 总结与对比
1. 背景介绍
一个好的分布式ID生成方案需要具备以下特性:
- 唯一性:生成的ID必须全局唯一,避免冲突。
- 高可用性:ID生成过程不能成为系统瓶颈,需要高可用。
- 高性能:在高并发环境下,能够高效生成ID。
- 有序性:对于某些应用场景,ID需要具备有序性。
2. 单点ID生成器
2.1 实现原理
单点ID生成器是一种较为简单的实现方式。在这种方案中,我们可以通过一个单独的服务生成ID,然后将其分发到需要的节点。
2.2 实现步骤
- 部署单点ID生成器服务:例如一个简单的REST API服务器。
- 生成ID:通过数据库自增序列或内存中的自增计数器生成唯一ID。
- 分发ID:通过API请求获取ID。
2.3 优缺点
优点:
- 实现简单,容易上手。
- ID具有全局唯一性。
缺点:
- 单点故障问题严重,服务挂掉会导致ID生成中断。
- 在高并发环境下,性能瓶颈明显。
3. 数据库自增序列
3.1 实现原理
利用关系型数据库中的自增序列特性,生成唯一的ID。
3.2 实现步骤
- 创建自增序列:如MySQL中的AUTO_INCREMENT或Oracle中的SEQUENCE。
- 获取ID:插入数据时自动生成并获取唯一ID。
3.3 优缺点
优点:
- 实现简单。
- ID有序性好。
缺点:
- 数据库成为单点瓶颈,性能有限。
- 难以扩展到多机房、多实例的分布式系统。
4. 基于Redis的ID生成方案
4.1 实现原理
利用Redis的原子操作特性,生成唯一ID。
4.2 实现步骤
- 在Redis中定义一个Key:表示ID的序列。
- **原子自增操作INCR**:通过Redis的INCR命令生成唯一ID。
4.3 优缺点
优点:
- Redis性能高,能够支持高并发。
- 实现较为简单。
缺点:
- Redis单点问题,需保证Redis的高可用性。
- 不支持本地生成ID,有一定网络延迟。
5. ZooKeeper分布式锁
5.1 实现原理
利用ZooKeeper强一致性的特性,通过分布式锁机制生成唯一ID。
5.2 实现步骤
- 创建ZooKeeper客户端:与ZooKeeper集群建立连接。
- 获取分布式锁:保证同一时间只有一个节点生成ID。
- 释放分布式锁:节点完成ID生成后,释放锁以供其他节点使用。
5.3 优缺点
优点:
- 强一致性,适用于需要严格顺序的应用场景。
- 高可用性较好。
缺点:
- 实现复杂,需维护ZooKeeper集群。
- 性能相对较低,特别是在高并发环境下。
6. Twitter Snowflake
6.1 实现原理
Snowflake算法是Twitter开源的一种分布式ID生成算法,采用64位整数生成唯一ID。结构如下:
- 1位符号位
- 41位时间戳
- 10位机器标识
- 12位序列号
6.2 实现步骤
- 定义Snowflake算法:包括时间戳、机器标识和序列号的组合生成ID。
- 实现ID生成器:在代码中实现算法逻辑。
6.3 优缺点
优点:
- 性能高,可生成大量唯一ID。
- 具备时间排序特性。
缺点:
- 时间回拨问题(服务器时间变化)需要处理。
- 机器ID需要分配和管理。
示例代码
public class SnowflakeIdWorker {
private final long twepoch = 1288834974657L;
private final long workerIdBits = 5L;
private final long datacenterIdBits = 5L;
private final long maxWorkerId = -1L ^ (-1L << workerIdBits);
private final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
private final long sequenceBits = 12L;
private final long workerIdShift = sequenceBits;
private final long datacenterIdShift = sequenceBits + workerIdBits;
private final long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;
private final long sequenceMask = -1L ^ (-1L << sequenceBits);
private long workerId;
private long datacenterId;
private long sequence = 0L;
private long lastTimestamp = -1L;
public SnowflakeIdWorker(long workerId, long datacenterId) {
if (workerId > maxWorkerId || workerId < 0) {
throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));
}
if (datacenterId > maxDatacenterId || datacenterId < 0) {
throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0", maxDatacenterId));
}
this.workerId = workerId;
this.datacenterId = datacenterId;
}
public synchronized long nextId() {
long timestamp = timeGen();
if (timestamp < lastTimestamp) {
throw new RuntimeException(String.format("Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
}
if (lastTimestamp == timestamp) {
sequence = (sequence + 1) & sequenceMask;
if (sequence == 0) {
timestamp = tilNextMillis(lastTimestamp);
}
} else {
sequence = 0L;
}
lastTimestamp = timestamp;
return ((timestamp - twepoch) << timestampLeftShift) |
(datacenterId << datacenterIdShift) |
(workerId << workerIdShift) |
sequence;
}
protected long tilNextMillis(long lastTimestamp) {
long timestamp = timeGen();
while (timestamp <= lastTimestamp) {
timestamp = timeGen();
}
return timestamp;
}
protected long timeGen() {
return System.currentTimeMillis();
}
}
7. 百度 UID Generator
7.1 实现原理
UID Generator是百度开源的一种分布式ID生成方案,它结合了时间戳、工作机器ID和序列号
7.2 实现步骤
- 定义UID生成结构:例如41位时间戳、10位工作机器ID和12位序列号。
- 实现生成逻辑:在代码中实现UID生成规则。
7.3 优缺点
优点:
- 性能高。
- 具有时间排序特性。
缺点:
- 需自行维护机器ID的分配和管理。
- 时间回拨问题需处理。
相关推荐
- B站收藏视频失效?mybili 收藏夹备份神器完整部署指南
-
本内容来源于@什么值得买APP,观点仅代表作者本人|作者:羊刀仙很多B站用户都有过类似经历:自己精心收藏的视频突然“消失”,点开一看不是“已被删除”,就是“因UP主设置不可见”。而B站并不会主动通知...
- 中间件推荐初始化配置
-
Redis推荐初始化配置bind0.0.0.0protected-modeyesport6379tcp-backlog511timeout300tcp-keepalive300...
- Redis中缓存穿透问题与解决方法
-
缓存穿透问题概述在Redis作为缓存使用时,缓存穿透是常见问题。正常查询流程是先从Redis缓存获取数据,若有则直接使用;若没有则去数据库查询,查到后存入缓存。但当请求的数据在缓存和数据库中都...
- 后端开发必看!Redis 哨兵机制如何保障系统高可用?
-
你是否曾在项目中遇到过Redis主服务器突然宕机,导致整个业务系统出现数据读取异常、响应延迟甚至服务中断的情况?面对这样的突发状况,作为互联网大厂的后端开发人员,如何快速恢复服务、保障系统的高可用...
- Redis合集-大Key处理建议
-
以下是Redis大Key问题的全流程解决方案,涵盖检测、处理、优化及预防策略,结合代码示例和最佳实践:一、大Key的定义与风险1.大Key判定标准数据类型大Key阈值风险场景S...
- 深入解析跳跃表:Redis里的"老六"数据结构,专治各种不服
-
大家好,我是你们的码农段子手,今天要给大家讲一个Redis世界里最会"跳科目三"的数据结构——跳跃表(SkipList)。这货表面上是个青铜,实际上是个王者,连红黑树见了都要喊声大哥。...
- Redis 中 AOF 持久化技术原理全解析,看完你就懂了!
-
你在使用Redis的过程中,有没有担心过数据丢失的问题?尤其是在服务器突然宕机、意外断电等情况发生时,那些还没来得及持久化的数据,是不是让你夜不能寐?别担心,Redis的AOF持久化技术就是...
- Redis合集-必备的几款运维工具
-
Redis在应用Redis时,经常会面临的运维工作,包括Redis的运行状态监控,数据迁移,主从集群、切片集群的部署和运维。接下来,从这三个方面,介绍一些工具。先来学习下监控Redis实时...
- 别再纠结线程池大小 + 线程数量了,没有固定公式的!
-
我们在百度上能很轻易地搜索到以下线程池设置大小的理论:在一台服务器上我们按照以下设置CPU密集型的程序-核心数+1I/O密集型的程序-核心数*2你不会真的按照这个理论来设置线程池的...
- 网络编程—IO多路复用详解
-
假如你想了解IO多路复用,那本文或许可以帮助你本文的最大目的就是想要把select、epoll在执行过程中干了什么叙述出来,所以具体的代码不会涉及,毕竟不同语言的接口有所区别。基础知识IO多路复用涉及...
- 5分钟学会C/C++多线程编程进程和线程
-
前言对线程有基本的理解简单的C++面向过程编程能力创造单个简单的线程。创造单个带参数的线程。如何等待线程结束。创造多个线程,并使用互斥量来防止资源抢占。会使用之后,直接跳到“汇总”,复制模板来用就行...
- 尽情阅读,技术进阶,详解mmap的原理
-
1.一句话概括mmapmmap的作用,在应用这一层,是让你把文件的某一段,当作内存一样来访问。将文件映射到物理内存,将进程虚拟空间映射到那块内存。这样,进程不仅能像访问内存一样读写文件,多个进程...
- C++11多线程知识点总结
-
一、多线程的基本概念1、进程与线程的区别和联系进程:进程是一个动态的过程,是一个活动的实体。简单来说,一个应用程序的运行就可以被看做是一个进程;线程:是运行中的实际的任务执行者。可以说,进程中包含了多...
- 微服务高可用的2个关键技巧,你一定用得上
-
概述上一篇文章讲了一个朋友公司使用SpringCloud架构遇到问题的一个真实案例,虽然不是什么大的技术问题,但如果对一些东西理解的不深刻,还真会犯一些错误。这篇文章我们来聊聊在微服务架构中,到底如...
- Java线程间如何共享与传递数据
-
1、背景在日常SpringBoot应用或者Java应用开发中,使用多线程编程有很多好处,比如可以同时处理多个任务,提高程序的并发性;可以充分利用计算机的多核处理器,使得程序能够更好地利用计算机的资源,...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle位图索引 (63)
- oracle批量插入数据 (62)
- oracle事务隔离级别 (53)
- oracle 空为0 (50)
- oracle主从同步 (55)
- oracle 乐观锁 (51)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)