百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

「一文搞懂」MySQL普通索引与唯一索引该如何选择?

mhr18 2024-12-02 17:27 19 浏览 0 评论

本章内容

普通索引与唯一索引

普通索引

普通索引是最基本的索引类型,它没有任何限制,允许索引列中存在重复值。创建普通索引可以加快查询速度,但不会强制保证数据的唯一性。

创建普通索引语法:

CREATE INDEX index_name ON table_name (column_name);

其中:

  • index_name:索引名称。
  • table_name:表名。
  • column_name:创建索引的列名。

唯一索引

唯一索引与普通索引类似,但它要求索引列中的值是唯一的,不允许重复。唯一索引可以用来保证数据的唯一性,常用于主键或唯一约束。

创建唯一索引语法:

CREATE UNIQUE INDEX index_name ON table_name (column_name);

其中:

  • index_name:索引名称。
  • table_name:表名。
  • column_name:创建索引的列名。

总结: 普通索引和唯一索引都可以提高查询效率,但唯一索引还能保证数据的唯一性。

本文将从性能角度分析普通索引和唯一索引该如何选择。

创建表:

create table t_user(
    id int primary key,
    card varchar(18),
    name varchar(30)
)engine=InnoDB;
insert into t_user values
(1,'432522222888228881','南秋同学1'),
(2,'432522222888228882','南秋同学2'),
(3,'432522222888228883','南秋同学3'),
(5,'432522222888228885','南秋同学5'),
(6,'432522222888228886','南秋同学6'),
(8,'432522222888228888','南秋同学8'),
(9,'432522222888228889','南秋同学9');

其中:

  • card:身份证号。
  • name:姓名。

由于身份证号字段长度较长,因此,选择基于card字段建立唯一索引或者普通索引。

查询过程分析

假如执行如下语句:

select id from t_user where card = '432522222888228885';

语句查找过程:先通过B+树从树根开始按层搜索到叶子节点(即:数据页),在数据页内部再通过二分法来定位记录:

  • 如果是普通索引,则查找到满足条件的第一个记录(1,'432522222888228885','南秋同学5')后,需要查找下一个记录,直到碰到第一个不满足card='432522222888228885'条件的记录。
  • 如果是唯一索引,由于索引定义了唯一性,查找到第一个满足条件的记录后,就会停止继续检索。

InnoDB的数据以数据页为单位进行读写。读取一条记录时,并不是从磁盘中读取该记录本身,而是以页为单位,将整个数据页读入内存。每个数据页的默认大小为16KB。

因此,当查找到card='432522222888228885'的记录时,该记录所在的数据页会读入内存中。对于普通索引来说,只是多做一次查找和判断(判断下一条记录是否符合条件)。即使card='432522222888228885'的记录刚好是数据页的最后一条记录,也只需读取下一个数据页,复杂度可以忽略不计。

因此,查询过程普通索引和唯一索引的性能没有明显差别。

更新过程分析

在分析普通索引和唯一索引对更新过程的性能影响之前,先说明一下change buffer。

change buffer

change buffer(变更缓冲区)是MySQL InnoDB存储引擎的一种优化机制,它可以提高对于插入、删除和更新操作的性能。在MySQL 5.5之前,change buffer只针对插入操作进行了优化,称为插入缓冲(insert buffer)。而在MySQL 5.5之后,change buffer进行了优化,对于删除和更新操作也有效,称为写缓冲(change buffer)。

change buffer结构,如图所示:

注:对buffer pool不了解的同学请移步主页查阅「一文搞懂」MySQL缓冲池(buffer pool)。

change buffer执行流程

change buffer写入流程

如图所示:

处理流程:

  • 对不在buffer pool中的普通索引(即:非唯一索引)数据页执行插入、删除或更新操作时,会将这些操作记录到change buffer中,而不是直接写入磁盘。
  • 对在buffer pool中的数据页执行插入、删除或更新操作时,直接更新buffer pool中的数据页。

以上操作会存在两次内存操作和一次磁盘操作:

  • 内存操作一:change buffer中记录写入操作。
  • 内存操作二:修改buffer pool的数据页。
  • 磁盘操作:将两条插入数据合并写入redo log(顺序写)中。

change buffer读取流程

如图所示:

处理流程:

  • 读取buffer pool中存在的数据页(即:page2)时,直接从buffer pool中返回即可。
  • 读取buffer pool中不存在的数据页(即:page1)时,需要先将page1从磁盘读入内存,再将change buffer中的操作日志merge生成一个正确的版本返回。

change buffer合并(merge)过程

将change buffer中的操作应用到磁盘上的数据页,得到新的数据页的过程称为merge。

merge触发时机:

  • 读取change buffer中记录的数据页时,会将change buffer合并到buffer pool 中,再将数据页刷新到磁盘。
  • 当系统空闲或者数据库正常关闭(shutdown)时,后台master线程发起merge。
  • change buffer的内存空间已满时,后台master线程会发起merge。

change buffer大小配置

change buffer使用的是buffer pool中的内存,其大小可通过参数innodb_change_buffer_max_size进行配置:

  • innodb_change_buffer_max_size表示change buffer占用buffer pool内存大小的百分比,默认为25%,最大为50%:
    • 当在系统中存在大量插入、更新、删除操作时,可以调大innodb_change_buffer_max_size参数值来提高系统的写入性能。
    • 当在系统中存在大量查询操作时,可以调小innodb_change_buffer_max_size参数值来减少buffer pool中数据页的淘汰概率,提高系统的读取性能。
  • innodb_change_buffer_max_size可动态调整,无需重新启动服务器。

change buffer类型配置

change buffer类型通过参数innodb_change_buffering进行配置:

  • all:默认值,缓冲区插入、删除和清除。
  • none:不缓存任何操作。
  • inserts:缓冲区插入操作。
  • deletes:缓冲区删除标记操作。
  • changes:缓冲区插入和删除标记操作。
  • purges:缓冲区在后台发生的物理删除操作。

查看change buffer配置信息命令:

show variables like '%innodb_change_buffering%';

change buffer只对普通索引生效的原因

唯一索引的更新、插入操作会先判断当前操作是否违反唯一性约束,该操作需要先将索引数据页读取到内存中,由于索引数据页已经读取到内存中,因此,更新、插入直接在内存中操作即可,无需change buffer支持。

普通索引的更新、插入操作无需判断当前操作是否违反唯一性约束,不需要将索引数据页读取到内存中,更新、插入需要change buffer来提升操作性能。

change buffer小结

通过使用change buffer,可以减少对磁盘的访问次数,提高对于插入、删除和更新操作的性能:

  • 对于大量DML操作(如:批量插入)的场景下,性能提升非常明显。
  • 对于更新数据后马上进行查询的场景,由于查询会触发merge过程,不但不会减少IO访问频次,反而会增加change buffer的维护代价。

更新过程

假如向t_user表中插入一条记录,执行语句:

insert into t_user values(7,'432522222888228887','南秋同学7');

要更新的数据页在内存中,处理流程:

  • 如果是普通索引,则找到card为432522222888228886和432522222888228888之间的位置,插入数据即可。
  • 如果是唯一索引,则找到card为432522222888228886和432522222888228888之间的位置,判断是否违反唯一性约束,没有违反唯一性约束,再插入数据。

因此,此种情况下,唯一索引和普通索引的区别只是多了一次唯一性约束判断,插入性能没有明显差别。

要更新的数据页不在内存中,处理流程:

  • 如果是普通索引,则只需将更新记录在change buffer中。
  • 如果是唯一索引,则需要将数据页读入内存,找到card为432522222888228886和432522222888228888之间的位置,判断是否违反唯一性约束,没有违反唯一性约束,再插入数据。

将数据从磁盘读入内存涉及随机IO访问,是数据库里面成本最高的操作之一。change buffer 由于减少了随机磁盘访问,因此对更新性能会有显著提升。

总结

普通索引和唯一索引在查询能力上没差别,主要考虑对更新性能的影响。因此,建议尽量选择普通索引。

【阅读推荐】

更多精彩内容,如:

  • Redis系列
  • 数据结构与算法系列
  • Nacos系列
  • MySQL系列
  • JVM系列
  • Kafka系列

请移步【南秋同学】个人主页进行查阅。内容持续更新中......

【作者简介】

一枚热爱技术和生活的老贝比,专注于Java领域,关注【南秋同学】带你一起学习成长~


相关推荐

Spring Boot 分布式事务实现简单得超乎想象

环境:SpringBoot2.7.18+Atomikos4.x+MySQL5.71.简介关于什么是分布式事务,本文不做介绍。有需要了解的自行查找相关的资料。本篇文章将基于SpringBoot...

Qt编写可视化大屏电子看板系统15-曲线面积图

##一、前言曲线面积图其实就是在曲线图上增加了颜色填充,单纯的曲线可能就只有线条以及数据点,面积图则需要从坐标轴的左下角和右下角联合曲线形成完整的封闭区域路径,然后对这个路径进行颜色填充,为了更美观...

Doris大数据AI可视化管理工具SelectDB Studio重磅发布!

一、初识SelectDBStudioSelectDBStudio是专为ApacheDoris湖仓一体典型场景实战及其兼容数据库量身打造的GUI工具,简化数据开发与管理。二、Select...

RAD Studio 、Delphi或C++Builder设计代码编译上线缩短开发时间

#春日生活打卡季#本月,Embarcadero宣布RADStudio12.3Athens以及Delphi12.3和C++Builder12.3,提供下载。RADStudio12.3A...

Mybatis Plus框架学习指南-第三节内容

自动填充字段基本概念MyBatis-Plus提供了一个便捷的自动填充功能,用于在插入或更新数据时自动填充某些字段,如创建时间、更新时间等。原理自动填充功能通过实现com.baomidou.myba...

「数据库」Sysbench 数据库压力测试工具

sysbench是一个开源的、模块化的、跨平台的多线程性能测试工具,可以用来进行CPU、内存、磁盘I/O、线程、数据库的性能测试。目前支持的数据库有MySQL、Oracle和PostgreSQL。以...

如何选择适合公司的ERP(选erp系统的经验之谈)

很多中小公司想搞ERP,但不得要领。上ERP的目的都是歪的,如提高效率,减少人员,堵住财务漏洞等等。真正用ERP的目的是借机提升企业管理能力,找出管理上的问题并解决,使企业管理更规范以及标准化。上ER...

Manus放开注册,但Flowith才是Agent领域真正的yyds

大家好,我是运营黑客。前天,AIAgent领域的当红炸子鸡—Manus宣布全面放开注册,终于,不需要邀请码就能体验了。于是,赶紧找了个小号去确认一下。然后,额……就被墙在了外面。官方解释:中文版...

歌浓酒庄总酿酒师:我们有最好的葡萄园和最棒的酿酒师

中新网1月23日电1月18日,张裕董事长周洪江及总经理孙健一行在澳大利亚阿德莱德,完成了歌浓酒庄股权交割签约仪式,这也意味着张裕全球布局基本成型。歌浓:澳大利亚年度最佳酒庄据悉,此次张裕收购的...

软件测试进阶之自动化测试——python+appium实例

扼要:1、了解python+appium进行APP的自动化测试实例;2、能根据实例进行实训操作;本课程主要讲述用python+appium对APP进行UI自动化测试的例子。appium支持Androi...

为什么说Python是最伟大的语言?看图就知道了

来源:麦叔编程作者:麦叔测试一下你的分析能力,直接上图,自己判断一下为什么Python是最好的语言?1.有图有真相Java之父-JamesGoshlingC++之父-BjarneStrou...

如何在Eclipse中配置Python开发环境?

Eclipse是著名的跨平台集成开发环境(IDE),最初主要用来Java语言开发。但是我们通过安装不同的插件Eclipse可以支持不同的计算机语言。比如说,我们可以通过安装PyDev插件,使Eclip...

联合国岗位上新啦(联合国的岗位)

联合国人权事务高级专员办事处PostingTitleIntern-HumanRightsDutyStationBANGKOKDeadlineOct7,2025CategoryandL...

一周安全漫谈丨工信部:拟定超1亿条一般数据泄露属后果严重情节

工信部:拟定超1亿条一般数据泄露属后果严重情节11月23日,工信部官网公布《工业和信息化领域数据安全行政处罚裁量指引(试行)(征求意见稿)》。《裁量指引》征求意见稿明确了行政处罚由违法行为发生地管辖、...

oracle列转行以及C#执行语句时报错问题

oracle列转行的关键字:UNPIVOT,经常查到的怎么样转一列,多列怎么转呢,直接上代码(sshwomeyourcode):SELECTsee_no,diag_no,diag_code,...

取消回复欢迎 发表评论: