百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

xcache介绍

mhr18 2024-12-03 11:33 22 浏览 0 评论

1. xcache是什么

xcache是由喜马拉雅系统架构团队基于开源项目codis,redis和pika深度定制开发的一套分布式KV持久化存储系统。该系统主要有以下几个特点:

  1. 完全支持redis协议,用户不需要修改任何代码,就可以将服务迁移至xcache
  2. 数据存储在磁盘上,解决了redis由于存储数据量巨大而导致内存容量瓶颈的问题
  3. 集群化部署,支持高并发,高可用,弹性伸缩容

PS:由于xcache对数据做了分片,所以有些redis原生的命令无法支持,具体请参考《xcache不支持命令列表》。

ps: pika使用手册(用户篇)

2. xcache整体架构

xcache的整体架构和codis-redis架构保持一致,最主要的区别是将codis-server组件替换成了pika组件,如下图:


在pika组件中,我们引入了一个缓存层(MEM-cache,该模块是基于redis实现),当存在冷热数据时,可以缓存热key到内存中,从而提高QPS以及降低命令延时。整体的命令调用流程如下:


3. xcache有什么特点

3.1 支持大value存储

xcache底层存储引擎支持string数据类型的kv分离存储,在value较大时,可以有效降低LSM的写放大问题,从而降低磁盘IO,减少命令延时。下图是我们对线上存储大value服务优化的效果。

kv分离存储前

kv分离存储后

优化前每天有10w左右的300ms超时报警,优化后每天1000左右,降低99%以上。


3.2 支持缓存热key

早期xcache的数据都是存储在磁盘上,这样就造成了内存的浪费。本着对资源充分利用的目的,xcache引入了一个缓存层,该模块是基于redis实现,支持动态开关。测试缓存命中时,可以大大提升QPS,并且降低访问延时,吞吐量测试数据如下:

缓存命中时,QPS大概提升了50%左右。


3.3 新增ehash数据类型

ehash是一种可为field设置过期时间的hash类型数据结构。支持和redis hash一样丰富的数据接口,极大地提高了hash数据结构的灵活性,简化了很多场景下的业务开发工作。

主要特性:

  • field支持单独设置过期时间
  • field过期后支持高效删除
  • 使用语法和原生redis hash数据类型类似


3.4 支持zset数据元素个数限长

xcache支持设置zset存储的最大元素个数,当超过用户设置的最大元素个数时,可以自动清理zset中不需要的数据,非常适合只保存定量历史数据的业务场景。

主要特性:

  • 支持设置zset保存的最大元素个数
  • 支持头部和尾部删除策略
  • 支持动态设置执行删除任务周期,错峰删除,避免影响线上业务
  • 支持手动执行删除任务


3.5 支持快慢命令分离

xcache支持将快命令和慢命令分离执行,这样可以有效降低命令之间的相互影响,避免执行较慢的命令阻塞执行较快的命令。下图是测试set和zadd命令,设置set为快命令,zadd为慢命令。set命令QPS为1w,zadd命令QPS为2w。

set命令延时

zadd命令延时

可以看出快慢命令分离前,set和zadd的延时毛刺都差不多,因为zadd和set命令在相同的执行队列中,zadd会阻塞set命令的执行。快慢命令分离后,zadd命令不会阻塞set命令,所以set的延时毛刺降低了很多,从200ms降低到了20ms左右,降低了90%

4. xcache和redis性能对比

4.1 配置

CPU: 48核,Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GHz

内存:128G

磁盘:1.5T(NVMe SSD)

OS:CentOS Linux release 7.7.1908 (Core)

4.2 测试过程

key长度:20字节

value长度:100字节(随机字符串)

redis数据容量大小:20G (string,list,hash,zset各5G)

xcache数据容量大小:400G(string,list,hash,zset各100G)

PS:考虑到pika底层hash结构和set结构存储协议一致,所以没有测试set数据类型。

4.3 测试结果

正常压力(每种命令测试1小时,并进行限速)



redis


xcache


操作

QPS

tp9999

tp100

tp9999

tp100

GET

10w

<10ms

<30ms

<25ms

<40ms

SET

5w

<12ms

<25ms

<40ms

<60ms

GET和SET混合

get:8w

set:2w

<30ms

<40ms

<40ms

<100ms

HGET

10w

<15ms

<40ms

<30ms

<40ms

HSET

5w

<12ms

<30ms

<60ms

<150ms

LINDEX

10w

<12ms

<35ms

<25ms

<40ms

LRANGE

5w

<15ms

<35ms

<30ms

<45ms

LPOP

5w

<10ms

<25ms

<40ms

<180ms

LPUSH

5w

<12ms

<30ms

<40ms

<100ms

ZRANGE

5w

<20ms

<35ms

<20ms

<38ms

ZRANGEBYSCORE

5w

<20ms

<35ms

<20ms

<40ms

ZADD

2w

<25ms

<25ms

<90ms

<300ms


最大吞吐量测试

操作

Redis 最大QPS

Xcache 最大QPS

GET

15w

20w

SET

13w

25w

HGET

14w

20w

HSET

13w

15w

LINDEX

15w

20w

LRANGE

13w

14w

LPOP

9.5w

14w

LPUSH

10w

19w

ZRANGE

10w

20w

ZRANGEBYSCORE

10w

18w

ZADD

9.5w

12w


4.4 结论

  1. 正常压力下,redis的tp9999在10ms左右,xcache的tp9999在30ms左右。
  2. xcache的tp100有延时抖动,可能会出现300ms左右的毛刺(测试1个小时,出现4条超过300ms以上延时毛刺),但redis比较稳定,没有超过40毫秒的延时。
  3. 单实例redis的最大QPS在10w左右,xcache的最大QPS可以达到20w左右,比redis高出50%

5. xcache适用场景

  1. 大数据容量(数据超过百GB,甚至TB级别)。目前xcache在喜马拉雅线上部署了上百个实例,承载的数据总量约20TB。
  2. 高并发。xcache底层是多线程实现,相比redis有着更高的吞吐量,测试一般情况下,QPS比redis高出一倍。
  3. 对延时要求不是特别高。xcache数据是存储在磁盘上的,读命令时会去读磁盘,有可能会产生延时毛刺,但写命令会直接写内存,速度较快。测试xcache的tp9999大概在30ms左右,tp100有可能产生上百毫秒延时抖动。
  4. 大value存储。对于string数据类型,xcache支持KB级别的value存储,并且有较好的性能表现。
  5. 存在冷热数据。xcache可以将热数据缓存到内部的多个redis db中,相当于redis的多线程版本,在读多写少的场景下,对性能有较高的提升。
  6. 对数据库有定制化需求。目前xcache为业务的小伙伴定制了ehash数据类型,zset限长功能以及业务垃圾数据清理工具,在提升业务吞吐量的同时,大大简化了业务小伙伴的开发成本。
  7. 不想陷入繁琐的DBA运维,避免客户端进行sharding。xcache是一站式的分布式KV存储解决方案,支持命令自动路由,数据节点弹性伸缩容,高可用等,并且还有一套完善的监控体系。

6. 如何从redis迁移到xcache

6.1 开发需要做的

客户端从jedis切换到jodis,其它不需要做任何事情,看DBA干活就好。

6.2 DBA需要做的

  1. 使用迁移工具将redis的数据迁移到xcache
  2. 同步实时数据,保证redis数据和xcache的数据最终一致
  3. 主从切换,将新的请求路由到xcache服务

7. 联系我们

  • 杨力,邮箱:scott.yang@ximalaya.com
  • 董道光,邮箱:jason.dong@ximalaya.com
  • github地址:https://github.com/XimalayaCloud/xcache

相关推荐

【推荐】一个开源免费、AI 驱动的智能数据管理系统,支持多数据库

如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!.前言在当今数据驱动的时代,高效、智能地管理数据已成为企业和个人不可或缺的能力。为了满足这一需求,我们推出了这款开...

Pure Storage推出统一数据管理云平台及新闪存阵列

PureStorage公司今日推出企业数据云(EnterpriseDataCloud),称其为组织在混合环境中存储、管理和使用数据方式的全面架构升级。该公司表示,EDC使组织能够在本地、云端和混...

对Java学习的10条建议(对java课程的建议)

不少Java的初学者一开始都是信心满满准备迎接挑战,但是经过一段时间的学习之后,多少都会碰到各种挫败,以下北风网就总结一些对于初学者非常有用的建议,希望能够给他们解决现实中的问题。Java编程的准备:...

SQLShift 重大更新:Oracle→PostgreSQL 存储过程转换功能上线!

官网:https://sqlshift.cn/6月,SQLShift迎来重大版本更新!作为国内首个支持Oracle->OceanBase存储过程智能转换的工具,SQLShift在过去一...

JDK21有没有什么稳定、简单又强势的特性?

佳未阿里云开发者2025年03月05日08:30浙江阿里妹导读这篇文章主要介绍了Java虚拟线程的发展及其在AJDK中的实现和优化。阅前声明:本文介绍的内容基于AJDK21.0.5[1]以及以上...

「松勤软件测试」网站总出现404 bug?总结8个原因,不信解决不了

在进行网站测试的时候,有没有碰到过网站崩溃,打不开,出现404错误等各种现象,如果你碰到了,那么恭喜你,你的网站出问题了,是什么原因导致网站出问题呢,根据松勤软件测试的总结如下:01数据库中的表空间不...

Java面试题及答案最全总结(2025版)

大家好,我是Java面试陪考员最近很多小伙伴在忙着找工作,给大家整理了一份非常全面的Java面试题及答案。涉及的内容非常全面,包含:Spring、MySQL、JVM、Redis、Linux、Sprin...

数据库日常运维工作内容(数据库日常运维 工作内容)

#数据库日常运维工作包括哪些内容?#数据库日常运维工作是一个涵盖多个层面的综合性任务,以下是详细的分类和内容说明:一、数据库运维核心工作监控与告警性能监控:实时监控CPU、内存、I/O、连接数、锁等待...

分布式之系统底层原理(上)(底层分布式技术)

作者:allanpan,腾讯IEG高级后台工程师导言分布式事务是分布式系统必不可少的组成部分,基本上只要实现一个分布式系统就逃不开对分布式事务的支持。本文从分布式事务这个概念切入,尝试对分布式事务...

oracle 死锁了怎么办?kill 进程 直接上干货

1、查看死锁是否存在selectusername,lockwait,status,machine,programfromv$sessionwheresidin(selectsession...

SpringBoot 各种分页查询方式详解(全网最全)

一、分页查询基础概念与原理1.1什么是分页查询分页查询是指将大量数据分割成多个小块(页)进行展示的技术,它是现代Web应用中必不可少的功能。想象一下你去图书馆找书,如果所有书都堆在一张桌子上,你很难...

《战场兄弟》全事件攻略 一般事件合同事件红装及隐藏职业攻略

《战场兄弟》全事件攻略,一般事件合同事件红装及隐藏职业攻略。《战场兄弟》事件奖励,事件条件。《战场兄弟》是OverhypeStudios制作发行的一款由xcom和桌游为灵感来源,以中世纪、低魔奇幻为...

LoadRunner(loadrunner录制不到脚本)

一、核心组件与工作流程LoadRunner性能测试工具-并发测试-正版软件下载-使用教程-价格-官方代理商的架构围绕三大核心组件构建,形成完整测试闭环:VirtualUserGenerator(...

Redis数据类型介绍(redis 数据类型)

介绍Redis支持五种数据类型:String(字符串),Hash(哈希),List(列表),Set(集合)及Zset(sortedset:有序集合)。1、字符串类型概述1.1、数据类型Redis支持...

RMAN备份监控及优化总结(rman备份原理)

今天主要介绍一下如何对RMAN备份监控及优化,这里就不讲rman备份的一些原理了,仅供参考。一、监控RMAN备份1、确定备份源与备份设备的最大速度从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两...

取消回复欢迎 发表评论: