百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

一个空格引发的“惨案“(一个空格引发的惨案)

mhr18 2024-10-14 11:07 14 浏览 0 评论

作者 | 践行精神自由

来源 | 互联网全栈架构

责编 | 屠敏

“案情”回顾(情景模拟):小张是一名软件工程师,工作兢兢业业、一丝不苟且精益求精,天性乐观的他每天愉快地做着增删改查的工作,对于这些看似简单的CRUD,小张从来不会掉以轻心,他也笃定地坚信,自己向数据库里插入了什么数据,就能按条件把这些数据查询出来,毕竟,像MySQL这样的数据库,在全世界广为流行,大行其道,不可能不严谨。

然而,意想不到的悲剧还是发生了。。。

小张做的项目与语言处理有点关系,他们把处理的结果也就是字符串保存到在数据库里面,后续需要按照条件把这些数据查询出来,但需要对这些字符串做严格的区分,也就是说,如果查询A字符串,不能把B字符串查询出来,哪怕这两个字符串只有一个空格的差异。对于这样的需求,小张觉得太天经地义了,根本无需多言,像MySQL这样的数据库天生就是干这样的事,所以当时就自信满满地拍着胸脯保证一定如期开发完成。

随着工作的推进,小张猛然发现MySQL对于字符串的处理貌似不那么严谨,特别是对于空格字符,比如这两个字符串:"Tom"和"Tom ",后面的字符串多了一个空格,然而,MySQL竟然把它们当成了相同的字符串。

我们来测试一下,看看具体的情况,先创建一个表:

CREATE TABLE `white_space`(
`id` bigint(20)unsigned NOT AUTO_INCREMENT,
`name`varchar(128) NOT DEFAULT '',
PRIMARY KEY (`id`)
) ENGINE=InnoDBDEFAULT CHARSET=utf8

然后向表里插入两条数据:

INSERT INTO white_space(name) VALUES('Tom');
INSERT INTO white_space(name) VALUES('Tom ');

注意,后面那条记录在最后多了一个空格。假设我们需要查询名字为Tom的记录(没有空格),SQL很简单:

SELECT * FROM white_space WHERE name = 'Tom';

然而,让小张大跌眼镜的是,上面的SQL竟然返回两条数据,也就是说,本来查找"Tom"(没有空格),却把"Tom "(有空格)也查询出来了:

这也太不严谨了,空格也是字符啊,为什么就生生的把它忽略了呢?这样的话,就满足不了项目的需求了,而且,小张还发现,不管后面有多少个空格,都会被忽略。我们再插入一条记录,名字是"Tom ",后面一共有10个空格:

INSERT INTO white_space(name) VALUES('Tom ');

再执行上面的查询语句,这时仍然还是返回了三条记录:

SELECT * FROM white_space WHERE name = 'Tom';

这简直太不可理喻了!感觉MySQL在这里完全无视空格的存在,但空格也是一个正正经经的字符啊,而且是一个非常常见的字符,咋就这么没有存在感呢。

当然,如果是前置空格,或者空格在中间是不会有这个问题的,比如数据库里保存的名字为" Tom"(最前面是一个空格),或者是"To m",再按"Tom"(没有空格)去查询的话,是找不到这条记录的。

这就麻烦了,当初可是拍着胸脯保证可以如期完成的,现在碰到这样的问题,小张可真是有点慌了神,不知道该如何来解决,而且这也是非常不可思议的事情,强悍如斯、威武如斯、名声震天响的MySQL竟然如此不严谨。幸亏空格不会说话,要不然它还不得骂街啊,作为一个名正言顺的字符,就这样生生地被忽略了,这也太不尊重人了。

事已至此,小张只能去寻找问题的解决方法,抱怨是没有用的,经过一番辛勤探索和研究,小张终于找到了办法,也就是加上BINARY关键字,像下面这样:

SELECT * FROM white_space WHERE BINARY name = 'Tom';

这时候就会严格地进行匹配,只返回了一条记录,如果要查询包含空格的记录,比如"Tom "(有空格),就会只返回有空格的这条记录:

SELECT * FROM white_space WHERE BINARY name = 'Tom ';

完美!项目就是需要这样的效果,字符串要进行严格的匹配与区分,现在加上BINARY关键字就彻底地解决了这个问题,小张不禁有些沾沾自喜,他也觉得MySQL确实太强大了,不管什么样的问题貌似都有办法解决,怪不得它会风靡全世界,成为了万千企业的首选。

然而,小张还没有高兴没多久,新的问题就又出现了。BINARY是MySQL独有的关键字,Oracle数据库并不认识什么BINARY,而项目需要适配不同的数据库,主要包括MySQL和Oracle。公司有一套ORM来做这样的适配,开发人员只要按照标准来写SQL就可以了,但是,如果在SQL语句中加上BINARY,切换到Oracle数据库就会出错,这可怎么办?!当然,也可以判断数据库的类型,如果是MySQL数据库,就加上BINARY关键字,否则就不加(Oracle数据库可以严格区分后置空格),但是,这样的改动也太大了,因为MySQL中的语句都完全忽略了后置空格的存在,比如GROUP BY:

SELECT name,COUNT(*) FROM white_space GROUP BY name

返回这样的结果:

也是完全忽略了后置空格,当然,加上BINARY也是可以解决问题的。

这样看来,只要涉及到需要严格区分字符串的地方,都需要做这样的改动,而这样的字段还有好几个,改动实在太大了!

事到如今,小张依然还没有找到完善的解决方案,开发的工期也一拖再拖,可以说是一桩不折不扣的“惨案”了。

亲爱的读者朋友,你有什么好的解决方案吗?欢迎后台留言讨论。

相关推荐

B站收藏视频失效?mybili 收藏夹备份神器完整部署指南

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:羊刀仙很多B站用户都有过类似经历:自己精心收藏的视频突然“消失”,点开一看不是“已被删除”,就是“因UP主设置不可见”。而B站并不会主动通知...

中间件推荐初始化配置

Redis推荐初始化配置bind0.0.0.0protected-modeyesport6379tcp-backlog511timeout300tcp-keepalive300...

Redis中缓存穿透问题与解决方法

缓存穿透问题概述在Redis作为缓存使用时,缓存穿透是常见问题。正常查询流程是先从Redis缓存获取数据,若有则直接使用;若没有则去数据库查询,查到后存入缓存。但当请求的数据在缓存和数据库中都...

后端开发必看!Redis 哨兵机制如何保障系统高可用?

你是否曾在项目中遇到过Redis主服务器突然宕机,导致整个业务系统出现数据读取异常、响应延迟甚至服务中断的情况?面对这样的突发状况,作为互联网大厂的后端开发人员,如何快速恢复服务、保障系统的高可用...

Redis合集-大Key处理建议

以下是Redis大Key问题的全流程解决方案,涵盖检测、处理、优化及预防策略,结合代码示例和最佳实践:一、大Key的定义与风险1.大Key判定标准数据类型大Key阈值风险场景S...

深入解析跳跃表:Redis里的"老六"数据结构,专治各种不服

大家好,我是你们的码农段子手,今天要给大家讲一个Redis世界里最会"跳科目三"的数据结构——跳跃表(SkipList)。这货表面上是个青铜,实际上是个王者,连红黑树见了都要喊声大哥。...

Redis 中 AOF 持久化技术原理全解析,看完你就懂了!

你在使用Redis的过程中,有没有担心过数据丢失的问题?尤其是在服务器突然宕机、意外断电等情况发生时,那些还没来得及持久化的数据,是不是让你夜不能寐?别担心,Redis的AOF持久化技术就是...

Redis合集-必备的几款运维工具

Redis在应用Redis时,经常会面临的运维工作,包括Redis的运行状态监控,数据迁移,主从集群、切片集群的部署和运维。接下来,从这三个方面,介绍一些工具。先来学习下监控Redis实时...

别再纠结线程池大小 + 线程数量了,没有固定公式的!

我们在百度上能很轻易地搜索到以下线程池设置大小的理论:在一台服务器上我们按照以下设置CPU密集型的程序-核心数+1I/O密集型的程序-核心数*2你不会真的按照这个理论来设置线程池的...

网络编程—IO多路复用详解

假如你想了解IO多路复用,那本文或许可以帮助你本文的最大目的就是想要把select、epoll在执行过程中干了什么叙述出来,所以具体的代码不会涉及,毕竟不同语言的接口有所区别。基础知识IO多路复用涉及...

5分钟学会C/C++多线程编程进程和线程

前言对线程有基本的理解简单的C++面向过程编程能力创造单个简单的线程。创造单个带参数的线程。如何等待线程结束。创造多个线程,并使用互斥量来防止资源抢占。会使用之后,直接跳到“汇总”,复制模板来用就行...

尽情阅读,技术进阶,详解mmap的原理

1.一句话概括mmapmmap的作用,在应用这一层,是让你把文件的某一段,当作内存一样来访问。将文件映射到物理内存,将进程虚拟空间映射到那块内存。这样,进程不仅能像访问内存一样读写文件,多个进程...

C++11多线程知识点总结

一、多线程的基本概念1、进程与线程的区别和联系进程:进程是一个动态的过程,是一个活动的实体。简单来说,一个应用程序的运行就可以被看做是一个进程;线程:是运行中的实际的任务执行者。可以说,进程中包含了多...

微服务高可用的2个关键技巧,你一定用得上

概述上一篇文章讲了一个朋友公司使用SpringCloud架构遇到问题的一个真实案例,虽然不是什么大的技术问题,但如果对一些东西理解的不深刻,还真会犯一些错误。这篇文章我们来聊聊在微服务架构中,到底如...

Java线程间如何共享与传递数据

1、背景在日常SpringBoot应用或者Java应用开发中,使用多线程编程有很多好处,比如可以同时处理多个任务,提高程序的并发性;可以充分利用计算机的多核处理器,使得程序能够更好地利用计算机的资源,...

取消回复欢迎 发表评论: