百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

深度解析:大型互联网公司分布式ID方案总结与实践

mhr18 2024-10-09 12:21 19 浏览 0 评论

在现代互联网架构中,不同服务分布在多个节点上进行协作是常态。为了确保各个节点生成的数据能够唯一且高效地进行标识,一个稳定的分布式ID生成方案至关重要。这篇文章将总结大型互联网公司在分布式ID生成方面的经验和实践,深入解析几种常见的分布式ID方案,帮助你选择并实现最合适的方案。


目录

  1. 背景介绍
  2. 单点ID生成器
  3. 数据库自增序列
  4. 基于Redis的ID生成方案
  5. ZooKeeper分布式锁
  6. Twitter Snowflake
  7. 百度 UID Generator
  8. 总结与对比

1. 背景介绍

一个好的分布式ID生成方案需要具备以下特性:

  • 唯一性:生成的ID必须全局唯一,避免冲突。
  • 高可用性:ID生成过程不能成为系统瓶颈,需要高可用。
  • 高性能:在高并发环境下,能够高效生成ID。
  • 有序性:对于某些应用场景,ID需要具备有序性。

2. 单点ID生成器

2.1 实现原理

单点ID生成器是一种较为简单的实现方式。在这种方案中,我们可以通过一个单独的服务生成ID,然后将其分发到需要的节点。

2.2 实现步骤

  1. 部署单点ID生成器服务:例如一个简单的REST API服务器。
  2. 生成ID:通过数据库自增序列或内存中的自增计数器生成唯一ID。
  3. 分发ID:通过API请求获取ID。

2.3 优缺点

优点:

  • 实现简单,容易上手。
  • ID具有全局唯一性。

缺点:

  • 单点故障问题严重,服务挂掉会导致ID生成中断。
  • 在高并发环境下,性能瓶颈明显。

3. 数据库自增序列

3.1 实现原理

利用关系型数据库中的自增序列特性,生成唯一的ID。

3.2 实现步骤

  1. 创建自增序列:如MySQL中的AUTO_INCREMENT或Oracle中的SEQUENCE。
  2. 获取ID:插入数据时自动生成并获取唯一ID。

3.3 优缺点

优点:

  • 实现简单。
  • ID有序性好。

缺点:

  • 数据库成为单点瓶颈,性能有限。
  • 难以扩展到多机房、多实例的分布式系统。

4. 基于Redis的ID生成方案

4.1 实现原理

利用Redis的原子操作特性,生成唯一ID。

4.2 实现步骤

  1. 在Redis中定义一个Key:表示ID的序列。
  2. **原子自增操作INCR**:通过Redis的INCR命令生成唯一ID。

4.3 优缺点

优点:

  • Redis性能高,能够支持高并发。
  • 实现较为简单。

缺点:

  • Redis单点问题,需保证Redis的高可用性。
  • 不支持本地生成ID,有一定网络延迟。

5. ZooKeeper分布式锁

5.1 实现原理

利用ZooKeeper强一致性的特性,通过分布式锁机制生成唯一ID。

5.2 实现步骤

  1. 创建ZooKeeper客户端:与ZooKeeper集群建立连接。
  2. 获取分布式锁:保证同一时间只有一个节点生成ID。
  3. 释放分布式锁:节点完成ID生成后,释放锁以供其他节点使用。

5.3 优缺点

优点:

  • 强一致性,适用于需要严格顺序的应用场景。
  • 高可用性较好。

缺点:

  • 实现复杂,需维护ZooKeeper集群。
  • 性能相对较低,特别是在高并发环境下。

6. Twitter Snowflake

6.1 实现原理

Snowflake算法是Twitter开源的一种分布式ID生成算法,采用64位整数生成唯一ID。结构如下:

  • 1位符号位
  • 41位时间戳
  • 10位机器标识
  • 12位序列号

6.2 实现步骤

  1. 定义Snowflake算法:包括时间戳、机器标识和序列号的组合生成ID。
  2. 实现ID生成器:在代码中实现算法逻辑。

6.3 优缺点

优点:

  • 性能高,可生成大量唯一ID。
  • 具备时间排序特性。

缺点:

  • 时间回拨问题(服务器时间变化)需要处理。
  • 机器ID需要分配和管理。

示例代码

public class SnowflakeIdWorker {
    private final long twepoch = 1288834974657L;
    private final long workerIdBits = 5L;
    private final long datacenterIdBits = 5L;
    private final long maxWorkerId = -1L ^ (-1L << workerIdBits);
    private final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
    private final long sequenceBits = 12L;
    private final long workerIdShift = sequenceBits;
    private final long datacenterIdShift = sequenceBits + workerIdBits;
    private final long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;
    private final long sequenceMask = -1L ^ (-1L << sequenceBits);
    private long workerId;
    private long datacenterId;
    private long sequence = 0L;
    private long lastTimestamp = -1L;

    public SnowflakeIdWorker(long workerId, long datacenterId) {
        if (workerId > maxWorkerId || workerId < 0) {
            throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));
        }
        if (datacenterId > maxDatacenterId || datacenterId < 0) {
            throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0", maxDatacenterId));
        }
        this.workerId = workerId;
        this.datacenterId = datacenterId;
    }

    public synchronized long nextId() {
        long timestamp = timeGen();

        if (timestamp < lastTimestamp) {
            throw new RuntimeException(String.format("Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
        }

        if (lastTimestamp == timestamp) {
            sequence = (sequence + 1) & sequenceMask;
            if (sequence == 0) {
                timestamp = tilNextMillis(lastTimestamp);
            }
        } else {
            sequence = 0L;
        }

        lastTimestamp = timestamp;

        return ((timestamp - twepoch) << timestampLeftShift) |
                (datacenterId << datacenterIdShift) |
                (workerId << workerIdShift) |
                sequence;
    }

    protected long tilNextMillis(long lastTimestamp) {
        long timestamp = timeGen();
        while (timestamp <= lastTimestamp) {
            timestamp = timeGen();
        }
        return timestamp;
    }

    protected long timeGen() {
        return System.currentTimeMillis();
    }
}

7. 百度 UID Generator

7.1 实现原理

UID Generator是百度开源的一种分布式ID生成方案,它结合了时间戳、工作机器ID和序列号

7.2 实现步骤

  1. 定义UID生成结构:例如41位时间戳、10位工作机器ID和12位序列号。
  2. 实现生成逻辑:在代码中实现UID生成规则。

7.3 优缺点

优点:

  • 性能高。
  • 具有时间排序特性。

缺点:

  • 需自行维护机器ID的分配和管理。
  • 时间回拨问题需处理。



相关推荐

B站收藏视频失效?mybili 收藏夹备份神器完整部署指南

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:羊刀仙很多B站用户都有过类似经历:自己精心收藏的视频突然“消失”,点开一看不是“已被删除”,就是“因UP主设置不可见”。而B站并不会主动通知...

中间件推荐初始化配置

Redis推荐初始化配置bind0.0.0.0protected-modeyesport6379tcp-backlog511timeout300tcp-keepalive300...

Redis中缓存穿透问题与解决方法

缓存穿透问题概述在Redis作为缓存使用时,缓存穿透是常见问题。正常查询流程是先从Redis缓存获取数据,若有则直接使用;若没有则去数据库查询,查到后存入缓存。但当请求的数据在缓存和数据库中都...

后端开发必看!Redis 哨兵机制如何保障系统高可用?

你是否曾在项目中遇到过Redis主服务器突然宕机,导致整个业务系统出现数据读取异常、响应延迟甚至服务中断的情况?面对这样的突发状况,作为互联网大厂的后端开发人员,如何快速恢复服务、保障系统的高可用...

Redis合集-大Key处理建议

以下是Redis大Key问题的全流程解决方案,涵盖检测、处理、优化及预防策略,结合代码示例和最佳实践:一、大Key的定义与风险1.大Key判定标准数据类型大Key阈值风险场景S...

深入解析跳跃表:Redis里的&quot;老六&quot;数据结构,专治各种不服

大家好,我是你们的码农段子手,今天要给大家讲一个Redis世界里最会"跳科目三"的数据结构——跳跃表(SkipList)。这货表面上是个青铜,实际上是个王者,连红黑树见了都要喊声大哥。...

Redis 中 AOF 持久化技术原理全解析,看完你就懂了!

你在使用Redis的过程中,有没有担心过数据丢失的问题?尤其是在服务器突然宕机、意外断电等情况发生时,那些还没来得及持久化的数据,是不是让你夜不能寐?别担心,Redis的AOF持久化技术就是...

Redis合集-必备的几款运维工具

Redis在应用Redis时,经常会面临的运维工作,包括Redis的运行状态监控,数据迁移,主从集群、切片集群的部署和运维。接下来,从这三个方面,介绍一些工具。先来学习下监控Redis实时...

别再纠结线程池大小 + 线程数量了,没有固定公式的!

我们在百度上能很轻易地搜索到以下线程池设置大小的理论:在一台服务器上我们按照以下设置CPU密集型的程序-核心数+1I/O密集型的程序-核心数*2你不会真的按照这个理论来设置线程池的...

网络编程—IO多路复用详解

假如你想了解IO多路复用,那本文或许可以帮助你本文的最大目的就是想要把select、epoll在执行过程中干了什么叙述出来,所以具体的代码不会涉及,毕竟不同语言的接口有所区别。基础知识IO多路复用涉及...

5分钟学会C/C++多线程编程进程和线程

前言对线程有基本的理解简单的C++面向过程编程能力创造单个简单的线程。创造单个带参数的线程。如何等待线程结束。创造多个线程,并使用互斥量来防止资源抢占。会使用之后,直接跳到“汇总”,复制模板来用就行...

尽情阅读,技术进阶,详解mmap的原理

1.一句话概括mmapmmap的作用,在应用这一层,是让你把文件的某一段,当作内存一样来访问。将文件映射到物理内存,将进程虚拟空间映射到那块内存。这样,进程不仅能像访问内存一样读写文件,多个进程...

C++11多线程知识点总结

一、多线程的基本概念1、进程与线程的区别和联系进程:进程是一个动态的过程,是一个活动的实体。简单来说,一个应用程序的运行就可以被看做是一个进程;线程:是运行中的实际的任务执行者。可以说,进程中包含了多...

微服务高可用的2个关键技巧,你一定用得上

概述上一篇文章讲了一个朋友公司使用SpringCloud架构遇到问题的一个真实案例,虽然不是什么大的技术问题,但如果对一些东西理解的不深刻,还真会犯一些错误。这篇文章我们来聊聊在微服务架构中,到底如...

Java线程间如何共享与传递数据

1、背景在日常SpringBoot应用或者Java应用开发中,使用多线程编程有很多好处,比如可以同时处理多个任务,提高程序的并发性;可以充分利用计算机的多核处理器,使得程序能够更好地利用计算机的资源,...

取消回复欢迎 发表评论: