加速mysql批量数据插入(mysql批量加载)
mhr18 2024-09-13 20:40 38 浏览 0 评论
问题描述:
由于测试需要,需要将生产库的一些数据导入到测试库进行开发测试。一些表的数据量有些多,达到6W+条,从生产库导出的文件达到10.6M,内容是每行一条插入语句(INSERT INTO TableName VALUES(…);)。
将这个导出的.sql文件通过工具载入到测试库后,点击了“运行”,只见信息栏一条条SQL语句“疯狂”的执行着,心想,应该很快应该执行完了吧,但是等了好一会儿,见到信息栏还在一条条努力的输出着插入的消息。
仔细看了下控制台,发现平均每条语句执行0.03s以上,多的甚至达到了0.09s,算了一下,如果按每条0.03s的速度执行,插入完这批数据一共需要花费0.03s/条*66176条=1985.28s,也就是大概33.088分钟!
这个时候,SQL已经执行了993.598s,也就是16多分钟,还要再执行16多分钟,才能将66176条数据插入完毕,这显然是不能忍的!
查询时间
分析解决尝试中。。。
为什么会这么慢呢?后来分析了一下,每个insert语句,大体都要经过发送数据到服务器端、解析SQL、预处理、优化SQL执行计划等步骤,有没有哪个步骤是可以优化或减少的呢?
顺着这个思路,后来把SQL语句改造了一下:
SQL改造
只保留一个INSERT INTO tableName,剩下的改为逗号相隔。这样做的好处,一是减少文件大小(改造前.sql文件10.6M,改造后,文件大小为8.09M),减少发送到服务器的时间;二是减少SQL语句多余的解析操作,改造后,只需要解析一次就可以进行数据插入操作。
后来通过工具的“状态”栏也可以证明这一点:
改造前后对比
状态
在寻求解决方案过程中,曾想到多线程,想找到一种像oracle中的并行操作技术parallel
insert /*+parallel(t 16)*/ into tableName(...)
但是没有找到,但无意中发现了一种更快的方法:加上事务!
START TRANSACTION;
INSERT INTO TABLE_NAME VALUES(...), (...), (...), ...;
COMMIT;
原因是:在进行insert操作时,mysql内部会建立一个事务,在事务内进行真正的处理。主动加上事务语句,可以减少创建事务的操作,减少执行时间。
通过这种方法,我做了下尝试,结果如下:
执行结果
相比于一条条插入语句,效率提高了100多倍!
总结:
通过改造SQL语句可以减少网络传输IO,减少解析时间,提高批量插入速度。通过主动创建事务,进一步减少执行时间。
这里需要注意的是,发送到服务器端的数据大小是有默认限制的,有的是1M,有的是4M,可以通过改动max_allowed_packet配置跳过该限制:
方法一(具有linux权限):改动服务器的mysql配置文件my.cnf,增加: max_allowed_packet=20M, 然后重启mysql服务
方法二(具有mysql修改配置权限):执行SQL语句,set global max_allowed_packet=20*1024*1024
相关推荐
- 如何检查 Linux 服务器是物理服务器还是虚拟服务器?
-
在企业级运维、故障排查和性能调优过程中,准确了解服务器的运行环境至关重要。无论是物理机还是虚拟机,都存在各自的优势与限制。在很多场景下,尤其是当你继承一台服务器而不清楚底层硬件细节时,如何快速辨识它是...
- 第四节 Windows 系统 Docker 安装全指南
-
一、Docker在Windows上的运行原理(一)架构限制说明Docker本质上依赖Linux内核特性(如Namespaces、Cgroups等),因此在Windows系统上无法直...
- C++ std:shared_ptr自定义allocator引入内存池
-
当C++项目里做了大量的动态内存分配与释放,可能会导致内存碎片,使系统性能降低。当动态内存分配的开销变得不容忽视时,一种解决办法是一次从操作系统分配一块大的静态内存作为内存池进行手动管理,堆对象内存分...
- Activiti 8.0.0 发布,业务流程管理与工作流系统
-
Activiti8.0.0现已发布。Activiti是一个业务流程管理(BPM)和工作流系统,适用于开发人员和系统管理员。其核心是超快速、稳定的BPMN2流程引擎。Activiti可以...
- MyBatis动态SQL的5种高级玩法,90%的人只用过3种
-
MyBatis动态SQL在日常开发中频繁使用,但大多数开发者仅掌握基础标签。本文将介绍五种高阶技巧,助你解锁更灵活的SQL控制能力。一、智能修剪(Trim标签)应用场景:动态处理字段更新,替代<...
- Springboot数据访问(整合Mybatis Plus)
-
Springboot整合MybatisPlus1、创建数据表2、引入maven依赖mybatis-plus-boot-starter主要引入这个依赖,其他相关的依赖在这里就不写了。3、项目结构目录h...
- 盘点金州勇士在奥克兰13年的13大球星 满满的全是...
-
见证了两个月前勇士与猛龙那个史诗般的系列赛后,甲骨文球馆正式成为了历史。那个大大的红色标志被一个字母一个字母地移除,在周四,一切都成为了过去式。然而这座,别名为“Roaracle”(译注:Roar怒吼...
- Mybatis入门看这一篇就够了(mybatis快速入门)
-
什么是MyBatisMyBatis本是apache的一个开源项目iBatis,2010年这个项目由apachesoftwarefoundation迁移到了googlecode,并且改名为M...
- Springboot数据访问(整合druid数据源)
-
Springboot整合druid数据源基本概念SpringBoot默认的数据源是:2.0之前:org.apache.tomcat.jdbc.pool.DataSource2.0及之后:com.z...
- Linux 中的 "/etc/profile.d" 目录有什么作用 ?
-
什么是/etc/profile.d/目录?/etc/profile.d/目录是Linux系统不可或缺的一部分保留配置脚本。它与/etc/profile文件相关联,这是一个启动脚本,该脚...
- 企业数据库安全管理规范(企业数据库安全管理规范最新版)
-
1.目的为规范数据库系统安全使用活动,降低因使用不当而带来的安全风险,保障数据库系统及相关应用系统的安全,特制定本数据库安全管理规范。2.适用范围本规范中所定义的数据管理内容,特指存放在信息系统数据库...
- Oracle 伪列!这些隐藏用法你都知道吗?
-
在Oracle数据库中,有几位特殊的“成员”——伪列,它们虽然不是表中真实存在的物理列,但却能在数据查询、处理过程中发挥出意想不到的强大作用。今天给大家分享Oracle伪列的使用技巧,无论...
- Oracle 高效处理数据的隐藏神器:临时表妙用
-
各位数据库搬砖人,在Oracle的代码世界里闯荡,处理复杂业务时,是不是总被数据“搅得头大”?今天给大家安利一个超实用的隐藏神器——临时表!当你需要临时存储中间计算结果,又不想污染正式数据表...
- Oracle 数据库查询:多表查询(oracle多表关联查询)
-
一、多表查询基础1.JOIN操作-INNERJOIN:返回两个表中满足连接条件的匹配行,不保留未匹配数据。SELECTa.emp_id,b.dept_nameFROMempl...
- 一文掌握怎么利用Shell+Python实现多数据源的异地备份程序
-
简介:在信息化时代,数据安全和业务连续性已成为企业和个人用户关注的焦点。无论是网站数据、数据库、日志文件,还是用户上传的文档、图片等,数据一旦丢失,损失难以估量。尤其是当数据分布在多个不同的目录、服务...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 如何检查 Linux 服务器是物理服务器还是虚拟服务器?
- 第四节 Windows 系统 Docker 安装全指南
- C++ std:shared_ptr自定义allocator引入内存池
- Activiti 8.0.0 发布,业务流程管理与工作流系统
- MyBatis动态SQL的5种高级玩法,90%的人只用过3种
- Springboot数据访问(整合Mybatis Plus)
- 盘点金州勇士在奥克兰13年的13大球星 满满的全是...
- Mybatis入门看这一篇就够了(mybatis快速入门)
- Springboot数据访问(整合druid数据源)
- Linux 中的 "/etc/profile.d" 目录有什么作用 ?
- 标签列表
-
- oracle位图索引 (74)
- oracle基目录 (50)
- oracle批量插入数据 (65)
- oracle事务隔离级别 (53)
- oracle主从同步 (55)
- oracle 乐观锁 (51)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)