百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

Redis 为啥scan命令的count对不上

mhr18 2025-04-24 04:32 56 浏览 0 评论

问题描述

在使用redis scan命令的时候发现这个count经常和实际的数据量对不上,count 3,4,5,出来的都是5个,只有部分是准的。这就有点神奇了。我们先看一下这个命令是干什么的,再看一下能不能从官网或者源码中寻找答案,为啥会出现这种现象。

问题追踪

scan命令

SCAN 命令是 Redis 提供的一种迭代器(iterator)方式,用于遍历数据库中的所有键(key)。该命令可以将遍历过程分成多个步骤,每次迭代只返回一小部分数据,这样可以有效地避免阻塞 Redis 服务器。具体来说,该命令的语法为:

SCAN cursor [MATCH pattern] [COUNT count]

其中,cursor 参数指定了迭代器当前的位置,可以将其看作是一个游标。在第一次调用时,该参数应该设置为 0MATCH 参数用于指定一个模式(pattern),只有符合模式的键才会被返回。COUNT 参数指定了每次迭代返回的最大键数。

命令KEYS 功能和SCAN 类似,但是不建议在生产环境使用,它需要遍历整个数据库来查找符合条件的键,因此在大型数据库中使用该命令可能会导致 Redis 服务器阻塞。

实现原理

1 redis的存储结构

typedef struct dict {
    dictType *type;
    void *privdata;
    dictht ht[2];
    long rehashidx; /* rehashing not in progress if rehashidx == -1 */
    unsigned long iterators; /* number of iterators currently running */
} dict;

redis的所有数据都是存到一个dict中去,删除的时候调用dictDelete(dict,key),添加调用dictAdd(dict, key, val)。其中ht的长度有2个,存了两个哈希表,dict使用第一个哈希表,第二个哈希表是对ht[0]进行rehash操作的时候使用的。我们继续看一下这个dictht哈希表,

typedef struct dictht {      // 总的hash表
    dictEntry **table;       // 存储的数组
    unsigned long size;      // 哈希表大小
    unsigned long sizemask;  // 用于计算index数据的索引index=dictHashKey(d, key) & d->ht[table].sizemask
    unsigned long used;      // 该哈希表中已有结点的数量
} dictht;

typedef struct dictEntry {   // kv条目,存储key和value指针
    void *key;
    union {
        void *val;
        uint64_t u64;
        int64_t s64;
        double d;
    } v;
    struct dictEntry *next;  // 指向下一个kv条目,形成链表
} dictEntry;

大致的结构如下:

暂时无法在文档外展示此内容

2 redis的scan流程

scan命令就是对这个dictht进行dictScan方法,

// dictScan简化版,不考虑正在rehash的情况
unsigned long dictScan(dict *d,               // 上文提到的dict
                       unsigned long v,       // 游标cursor
                       dictScanFunction *fn,  // 数据收集函数
                       void *privdata)
{
    dictht *t0;
    const dictEntry *de, *next;
    unsigned long m0;

    t0 = &(d->ht[0]);
    m0 = t0->sizemask;

    de = t0->table[v & m0];                // 上文提到的dictEntry
    while (de) {                           // 遍历链表
        next = de->next;
        fn(privdata, de);                  // 把数据放入收集函数
        de = next;
    }

    // 返回下一个游标
    v |= ~m0;
    v = rev(v);
    v++;                    
    v = rev(v);

    return v;
}

从dictScan方法可以看到每次dictScan是scan一个链表,不是scan一个值。

再看一下这个dictScan方法是怎么被调用的

long maxiterations = count*10;

/* We pass two pointers to the callback: the list to which it will
 * add new elements, and the object containing the dictionary so that
 * it is possible to fetch more data in a type-dependent way. */
do {
    cursor = dictScan(ht, cursor, scanCallback, NULL, privdata);
} while (cursor &&
      maxiterations-- &&
      listLength(keys) < (unsigned long)count);

这个dictScan方法最多调用count * 10 次,如果count*10次之后还是len(keys) < count, 这个时候就会出现数据小于count的情况。每次dictScan都是扫描一个链表,所以当链表中的值有多个时,会存在len(keys)>count的情况。

redis 为啥不返回确切的数量,而是选择返回一个忽大忽小的数量,这个是出于性能考虑的,反正这个count的大小对功能来说没有什么影响,没有必要这么处理。

AI回答

上面的人工回答可能描述不够清楚,再补一个当下比较热门的AI回答。

总结

通过Redis的scan命令的count数据对不上,我们顺着流程又梳理redis的存储结构。就是通过无数个这种小设计,从而实现软件的高性能。

相关推荐

【推荐】一个开源免费、AI 驱动的智能数据管理系统,支持多数据库

如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!.前言在当今数据驱动的时代,高效、智能地管理数据已成为企业和个人不可或缺的能力。为了满足这一需求,我们推出了这款开...

Pure Storage推出统一数据管理云平台及新闪存阵列

PureStorage公司今日推出企业数据云(EnterpriseDataCloud),称其为组织在混合环境中存储、管理和使用数据方式的全面架构升级。该公司表示,EDC使组织能够在本地、云端和混...

对Java学习的10条建议(对java课程的建议)

不少Java的初学者一开始都是信心满满准备迎接挑战,但是经过一段时间的学习之后,多少都会碰到各种挫败,以下北风网就总结一些对于初学者非常有用的建议,希望能够给他们解决现实中的问题。Java编程的准备:...

SQLShift 重大更新:Oracle→PostgreSQL 存储过程转换功能上线!

官网:https://sqlshift.cn/6月,SQLShift迎来重大版本更新!作为国内首个支持Oracle->OceanBase存储过程智能转换的工具,SQLShift在过去一...

JDK21有没有什么稳定、简单又强势的特性?

佳未阿里云开发者2025年03月05日08:30浙江阿里妹导读这篇文章主要介绍了Java虚拟线程的发展及其在AJDK中的实现和优化。阅前声明:本文介绍的内容基于AJDK21.0.5[1]以及以上...

「松勤软件测试」网站总出现404 bug?总结8个原因,不信解决不了

在进行网站测试的时候,有没有碰到过网站崩溃,打不开,出现404错误等各种现象,如果你碰到了,那么恭喜你,你的网站出问题了,是什么原因导致网站出问题呢,根据松勤软件测试的总结如下:01数据库中的表空间不...

Java面试题及答案最全总结(2025版)

大家好,我是Java面试陪考员最近很多小伙伴在忙着找工作,给大家整理了一份非常全面的Java面试题及答案。涉及的内容非常全面,包含:Spring、MySQL、JVM、Redis、Linux、Sprin...

数据库日常运维工作内容(数据库日常运维 工作内容)

#数据库日常运维工作包括哪些内容?#数据库日常运维工作是一个涵盖多个层面的综合性任务,以下是详细的分类和内容说明:一、数据库运维核心工作监控与告警性能监控:实时监控CPU、内存、I/O、连接数、锁等待...

分布式之系统底层原理(上)(底层分布式技术)

作者:allanpan,腾讯IEG高级后台工程师导言分布式事务是分布式系统必不可少的组成部分,基本上只要实现一个分布式系统就逃不开对分布式事务的支持。本文从分布式事务这个概念切入,尝试对分布式事务...

oracle 死锁了怎么办?kill 进程 直接上干货

1、查看死锁是否存在selectusername,lockwait,status,machine,programfromv$sessionwheresidin(selectsession...

SpringBoot 各种分页查询方式详解(全网最全)

一、分页查询基础概念与原理1.1什么是分页查询分页查询是指将大量数据分割成多个小块(页)进行展示的技术,它是现代Web应用中必不可少的功能。想象一下你去图书馆找书,如果所有书都堆在一张桌子上,你很难...

《战场兄弟》全事件攻略 一般事件合同事件红装及隐藏职业攻略

《战场兄弟》全事件攻略,一般事件合同事件红装及隐藏职业攻略。《战场兄弟》事件奖励,事件条件。《战场兄弟》是OverhypeStudios制作发行的一款由xcom和桌游为灵感来源,以中世纪、低魔奇幻为...

LoadRunner(loadrunner录制不到脚本)

一、核心组件与工作流程LoadRunner性能测试工具-并发测试-正版软件下载-使用教程-价格-官方代理商的架构围绕三大核心组件构建,形成完整测试闭环:VirtualUserGenerator(...

Redis数据类型介绍(redis 数据类型)

介绍Redis支持五种数据类型:String(字符串),Hash(哈希),List(列表),Set(集合)及Zset(sortedset:有序集合)。1、字符串类型概述1.1、数据类型Redis支持...

RMAN备份监控及优化总结(rman备份原理)

今天主要介绍一下如何对RMAN备份监控及优化,这里就不讲rman备份的一些原理了,仅供参考。一、监控RMAN备份1、确定备份源与备份设备的最大速度从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两...

取消回复欢迎 发表评论: