百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

Redis 8为向量相似性推出新的数据结构

mhr18 2025-05-15 19:29 18 浏览 0 评论

作者 | Renato Losio
审校 | 明知山
策划 | Tina

Redis 最近推出向量集合(Vector Set) 功能,这是一种专为向量相似性设计的数据类型,也是 Redis 针对人工智能应用的一个新的选项。这是 Redis 创始人 Salvatore Sanfilippo(“antirez”)自 重新加入 公司以来的第一个重大贡献。

向量集合 是一种类似于有序集合(Sorted Set)的数据类型,不一样的是它将字符串元素与向量(而不是分数)关联起来,可以添加项目并检索与指定向量最相似的子集。它还支持过滤搜索功能,允许同时进行向量相似性和标量过滤。Sanfilippo 在他的博客中解释道:

简单来说,这个新的数据结构的目标是创建一种类似于有序集合的“集合类”数据类型,但分数是一个向量而不是标量。你可以像使用普通 Redis 数据结构一样添加和删除元素,无需担心其他问题,只需关注 Redis 抽象数据结构本身的特性即可。你可以查询与给定向量(或集合中已有的某个元素的向量)相似的元素,等等。

向量集合基于 hnsw.c 的 HNSW 数据结构实现,并进行了速度和特性方面的扩展。Redis 首席执行官 Rowan Trollope 称赞了 Sanfilippo 所做的贡献:

他的专业知识催生了一个简单直观的 API,这体现了 Redis 提供高性能解决方案的理念,同时保持了极简的复杂性。

向量数据库对于由生成式人工智能驱动的应用程序来说至关重要,它们可以检索语义相关的信息,用来丰富大语言模型(RAG)的上下文。其他的应用场景还包括:聊天机器人的语义缓存、推荐系统和人脸识别。Redis 产品经理 Mirko Ortensi 在另一篇文章中解释了如何 使用向量集合进行人脸识别。Ortensi 写道:

人脸识别本质上是基于向量的计算过程。它使用专门的嵌入模型对已知的人脸图像进行建模,并将映射后的向量存储在 Redis 中,然后通过搜索在数据库中存储的向量来实现人脸识别。

来源:Mirco Ortensi

Sanfilippo 补充道:

实现向量相似性搜索的基本要求是从头开始重新实现 HNSW(你可以在 hnsw.c 中看到我的实现),因为这将成为核心数据结构,我不想从 GitHub 上抓取一些随机代码来应付了事。

专注于高性能,Sanfilippo 不仅对 HNSW 进行了修改,还为所有向量相似性搜索请求引入了多线程特性,并支持 8 位和二进制量化。他强调了他的实现与其他数据结构的主要区别:

向量集合最有趣的部分是数据模型和相关的 API。许多数据库将向量相似性作为一种索引,但 Redis 不一样,Redis 里的东西是数据结构:这次也不例外。

向量集合并不是 Redis 唯一的新特性:LangCache 是一个专门为人工智能应用和智能体设计的语义缓存服务,旨在通过缓存它们的响应来减少对大语言模型的调用。

向量集合功能随 Redis 8 RC1 发布,目前处于预览阶段,许可协议为 RSALv2 或 SSPLv1。

查看英文原文

https://www.infoq.com/news/2025/04/redis-vector-sets/

声明:本文由 InfoQ 翻译,未经许可禁止转载。

今日好文推荐
让PostgreSQL更契合Agent、氛围编程!成立四年、微软投资,这家开源数据库公司终10亿美元卖身Databricks
二十年老牌 IDE 栽在 AI 上!JetBrains 被差评逼疯批量删除评论,用户怒打更多1星抗议
OpenAI 黑科技 Deep Research 诞生记:一个工程师的“不务正业”如何改变 AI 战争格局
名校硕士AI造假面试现场“社死”!差点蒙混过关,因一个基本错误被识破,面试官:软件圈很小,好自为之

相关推荐

甲骨文签署多项大型云协议,其一未来可贡献超300亿美元年收入

IT之家7月1日消息,根据甲骨文Oracle当地时间6月30日向美国证券交易委员会(SEC)递交的FORM8-K文件,该企业在始于2025年6月1日的202...

甲骨文获TEMU巨额合同,后者大部分基础设施将迁移至Oracle云

IT之家6月23日消息,Oracle甲骨文创始人、董事长兼首席技术官LarryEllison(拉里埃里森)在本月早些时候的2025财年第四财季和全财年财报电话会议上表示,Oracle...

Spring Boot 自定义数据源设置,这些坑你踩过吗?

你在使用SpringBoot进行后端开发的过程中,是不是也遇到过这样的问题:项目上线后,数据库连接总是不稳定,偶尔还会出现数据读取缓慢的情况,严重影响了用户体验。经过排查,发现很大一部分原因竟然...

一个开箱即用的代码生成器(一个开箱即用的代码生成器是什么)

今天给大家推荐一个好用的代码生成器,名为renren-generator,该项目附带前端页面,可以很方便的选择我们所需要生成代码的表。首先我们通过git工具克隆下来代码(地址见文末),导入idea。...

低代码建模平台-数据挖掘平台(低代码平台的实现方式)

现在来看一下数据连接。·这里是管理数据连接的空间,点击这里可以新增一个数据连接。·输入连接名称,然后输入url,是通过gdbc的方式去连接的数据库,目前是支持mysql、oracle以及国产数据库达梦...

navicat 17.2.7连接oracle数据库提示加载oracle库失败

系统:macOS15.5navicat版本:navicatpremiumlite17.2.7连接oracle测试报错:加载oracle库失败【解决办法】:放达里面找到程序,显示简介里面勾选“使...

开源“Windows”ReactOS更新:支持全屏应用

IT之家6月17日消息,ReactOS团队昨日(6月16日)在X平台发布系列推文,公布了该系统的最新进展,包括升级Explorer组件,支持全屏应用,从Wine项目引入了...

SSL 推出采用全模拟内置混音技术的模拟调音台Oracle

英国调音台传奇品牌SolidStateLogic宣布推出Oracle——一款采用全模拟内置混音技术的调音台,在紧凑的AWS尺寸机箱内集成了大型调音台的功能。该调音台提供24输入和...

47道网络工程师常见面试题,看看有没有你不会的!

你们好,我的网工朋友。网络工程师面试的时候,都会被问到什么?这个问题其实很泛,一般来说,你肯定要先看明白岗位需求写的是什么。基本上都是围绕公司需要的业务去问的。但不可否认的是,那些最基础的概念,多少也...

汉得信息:发布EBS系统安装启用JWS的高效解决方案

e公司讯,从汉得信息获悉,近日,微软官方宣布InternetExplorer桌面应用程序将于2022年6月15日正式停用。目前大部分客户都是使用IE浏览器打开EBS的Form界面,IE停用后,只能使...

36.9K star ! 推荐一个酷炫低代码开发平台!功能太强!

前言最近在逛github,看看能不能搜罗到一些对自己有帮助的开源软件。不经意间看到一个高star的java开源项目:jeecg-boot。进入在线演示版一看,感叹实在是太牛了!此开源项目不管是给来学习...

Linux新手入门系列:Linux下jdk安装配置

本系列文章是把作者刚接触和学习Linux时候的实操记录分享出来,内容主要包括Linux入门的一些理论概念知识、Web程序、mysql数据库的简单安装部署,希望能够帮到一些初学者,少走一些弯路。注意:L...

手把手教你在嵌入式设备中使用SQLite3

摘要:数据库是用来存储和管理数据的专用软件,使得管理数据更加安全,方便和高效。数据库对数据的管理的基本单位是表(table),在嵌入式linux中有时候它也需要用到数据库,听起来好难,其实就是几个函数...

JAVA语言基础(java语言基础知识)

一、计算机的基本概念什么是计算机?计算机(Computer)全称:电子计算机,俗称电脑。是一种能够按照程序运行、自动高速处理海量数据的现代化智能电子设备。由硬件和软件组成、没有安装过任何软件的计算机称...

再见 Navicat!一款开源的 Web 数据库管理工具!

大家好,我是Java陈序员。在日常的开发工作中,常常需要与各种数据库打交道。而为了提高工作效率,常常会使用一些可视化工具进行操作数据库。今天,给大家介绍一款开源的数据库管理工具,无需下载安装软件,基...

取消回复欢迎 发表评论: