MyBatis 批量插入几千条数据,请慎用Foreach

大家好,我是磊哥。

最近在项目中遇到了一个耗时较长的Job,其CPU占用率过高,经排查发现,主要时间消耗在通过MyBatis进行批量数据插入。mapper配置文件中使用了foreach循环进行批量插入,大致如下所示。(由于项目保密,以下代码均为自己手写的demo代码)

    insert into USER (id, name) values            (#{model.id}, #{model.name})    

这种方法提升批量插入速度的原理是,将传统的:

INSERT INTO `table1` (`field1`, `field2`) VALUES ("data1", "data2");INSERT INTO `table1` (`field1`, `field2`) VALUES ("data1", "data2");INSERT INTO `table1` (`field1`, `field2`) VALUES ("data1", "data2");INSERT INTO `table1` (`field1`, `field2`) VALUES ("data1", "data2");INSERT INTO `table1` (`field1`, `field2`) VALUES ("data1", "data2");

转化为:

INSERT INTO `table1` (`field1`, `field2`) VALUES ("data1", "data2"),("data1", "data2"),("data1", "data2"),("data1", "data2"),("data1", "data2");

在MySQL文档中也提到过这个技巧,如果要优化插入速度,可以将多个小操作合并成一个大操作。理想情况下,这样可以在单个连接中一次性发送许多新行的数据,并将所有索引更新和一致性检查推迟到最后进行。

乍一看,这个foreach循环似乎没有问题,但在项目实践中发现,当表的列数较多(20+)且一次性插入的行数较多(5000+)时,整个插入过程耗时非常长,达到了14分钟,这显然是不可接受的。资料中也提到了一句话:

Of course don’t combine ALL of them, if the amount is HUGE. Say you have 1000 rows you need to insert, then don’t do it one at a time. You shouldn’t equally try to have all 1000 rows in a single query. Instead break it into smaller sizes.

这句话强调,当插入数量很大时,不能将所有数据一次性放在一条语句中。那么,为什么不能将所有数据放在同一条语句中呢?为什么这条语句会耗时这么长呢?我查阅了资料后发现:

Insert inside Mybatis foreach is not batch, this is a single (could become giant) SQL statement and that brings drawbacks:

some database such as Oracle here does not support.

in relevant cases: there will be a large number of records to insert and the database configured limit (by default around 2000 parameters per statement) will be hit, and eventually possibly DB stack error if the statement itself become too large.

Iteration over the collection must not be done in the mybatis XML. Just execute a simple Insertstatement in a Java Foreach loop. The most important thing is the session Executor type.

SqlSession session = sessionFactory.openSession(ExecutorType.BATCH);for (Model model : list) {    session.insert("insertStatement", model);}session.flushStatements();

与默认的ExecutorType.SIMPLE不同,BATCH类型的执行器会在每次插入记录时准备一次语句并执行。

从资料中可以得知,默认的执行器类型为Simple,会为每个语句创建一个新的预处理语句,即创建一个PreparedStatement对象。在我们的项目中,会不断地使用这个批量插入方法,而由于MyBatis无法对包含的语句进行缓存,所以每次调用方法时,都会重新解析SQL语句。

Kerqu.Ai Kerqu.Ai

专为电商设计的一站式AI创作平台

Kerqu.Ai 202 查看详情 Kerqu.Ai

Internally, it still generates the same single insert statement with many placeholders as the JDBC code above.

MyBatis has an ability to cache PreparedStatement, but this statement cannot be cached because it contains element and the statement varies depending on the parameters. As a result, MyBatis has to 1) evaluate the foreach part and 2) parse the statement string to build parameter mapping [1] on every execution of this statement.

And these steps are relatively costly process when the statement string is big and contains many placeholders.

[1] simply put, it is a mapping between placeholders and the parameters.

从上述资料可知,耗时主要在于,由于foreach后有5000+个values,所以这个PreparedStatement特别长,包含了很多占位符,对占位符和参数的映射尤其耗时。并且,查阅相关资料可知,values的增长与所需的解析时间,是呈指数型增长的。

MyBatis 批量插入几千条数据,请慎用Foreach

所以,如果非要使用foreach的方式进行批量插入,可以考虑减少一条insert语句中values的个数,最好能达到上述曲线的最低点,使速度最快。一般根据经验,一次性插入20~50行的数量是比较合适的,时间消耗也能接受。

重点来了。上面讲的是,如果非要使用的方式进行插入,可以提升性能的方法。而实际上,MyBatis文档中推荐的批量插入方法是另一种方式。(可以参考http://www.mybatis.org/mybatis-dynamic-sql/docs/insert.html中的Batch Insert Support部分)

SqlSession session = sqlSessionFactory.openSession(ExecutorType.BATCH);try {    SimpleTableMapper mapper = session.getMapper(SimpleTableMapper.class);    List records = getRecordsToInsert(); // not shown    BatchInsert batchInsert = insert(records)            .into(simpleTable)            .map(id).toProperty("id")            .map(firstName).toProperty("firstName")            .map(lastName).toProperty("lastName")            .map(birthDate).toProperty("birthDate")            .map(employed).toProperty("employed")            .map(occupation).toProperty("occupation")            .build()            .render(RenderingStrategy.MYBATIS3);    batchInsert.insertStatements().stream().forEach(mapper::insert);    session.commit();} finally {    session.close();}

基本思想是将MyBatis session的executor type设置为Batch,然后多次执行插入语句。这类似于JDBC中的以下语句:

Connection connection = DriverManager.getConnection("jdbc:mysql://127.0.0.1:3306/mydb?useUnicode=true&characterEncoding=UTF-8&useServerPrepStmts=false&rewriteBatchedStatements=true","root","root");connection.setAutoCommit(false);PreparedStatement ps = connection.prepareStatement(        "insert into tb_user (name) values(?)");for (int i = 0; i < 100000; i++) {    ps.setString(1, "name_" + i);    ps.addBatch();}ps.executeBatch();connection.commit();

经过试验,使用ExecutorType.BATCH的插入方式,性能显著提升,不到2秒便能全部插入完成。

总结一下,如果MyBatis需要进行批量插入,推荐使用ExecutorType.BATCH的插入方式,如果非要使用的插入方式,需要将每次插入的记录控制在20~50左右。

以上就是MyBatis 批量插入几千条数据,请慎用Foreach的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/819090.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月27日 02:22:27
下一篇 2025年11月27日 02:25:03

相关推荐

  • Magento 2 静态资源加载异常:解决 pub 路径缺失问题

    本教程旨在解决 Magento 2.4.3 及更高版本安装后,前端CSS和JS资源无法加载的问题,该问题通常是由于静态文件URL中缺少/pub路径所致。文章将详细指导用户如何通过数据库配置或重新安装时的正确设置来修复此问题,确保网站样式和脚本正常显示。 问题概述 在 Magento 2.4.3 及更…

    2025年12月11日
    000
  • 配置PhpStorm自动保存功能的参数

    phpstorm 实现自动保存需手动设置。1. 打开 settings(windows/linux)或 preferences(macos),进入 appearance & behavior → system settings;2. 勾选 save files when switching …

    2025年12月11日 好文分享
    000
  • 对PHPMyAdmin进行安全漏洞扫描的方法

    要对phpmyadmin进行安全漏洞扫描,关键在于选择合适工具并定期维护。1. 选择工具时,明确需求,评估更新频率、社区支持、易用性和报告质量;2. 常见漏洞包括sql注入、xss攻击及配置问题;3. 定期更新phpmyadmin版本,备份数据库,审查配置并进行安全扫描以确保安全。 直接对phpMy…

    2025年12月11日 好文分享
    000
  • 解决 Laravel 与 Vue.js 应用中数据无法正确显示的问题

    本文旨在帮助开发者解决在使用 Laravel REST API 和 Vue.js 构建应用时,数据无法正确显示的问题。通过分析常见错误原因,并提供修正后的代码示例,本文将指导你如何正确地从 Laravel 后端获取数据,并在 Vue.js 前端进行渲染,确保数据能够顺利展示。 问题分析 当 Vue.…

    2025年12月11日
    000
  • 解决 Laravel 与 Vue.js 应用数据无法正确显示的问题

    本文旨在解决 Laravel REST API 与 Vue.js 前端应用集成时,数据无法正确显示的问题。通过分析常见错误原因,提供后端数据格式化以及前端数据接收和处理的正确方法,帮助开发者顺利实现前后端数据的有效交互,避免出现 “Property or method is not de…

    2025年12月11日
    000
  • 使用 jQuery 进行 Ajax 请求并 JSON 解码结果

    本文旨在帮助开发者理解如何使用 jQuery 发送 Ajax 请求,并对接收到的 JSON 格式数据进行解码和处理。我们将通过一个实际示例,展示如何将服务器端返回的动态 HTML 代码嵌入到页面中,并提供关键代码片段和注意事项,确保您能顺利地将此技术应用到您的项目中。 使用 jQuery 发送 Aj…

    2025年12月11日
    000
  • 如何安全高效地通过AJAX更新MySQL数据

    本文旨在提供一套完整的指南,讲解如何通过AJAX技术安全且高效地更新MySQL数据库。内容涵盖前端HTML结构优化、采用现代Fetch API进行异步请求、以及后端PHP中至关重要的预处理语句(Prepared Statements)以防止SQL注入,确保数据操作的安全性与可靠性。 优化前端交互与数…

    2025年12月11日
    000
  • AJAX与MySQL异步更新:常见问题、安全实践与优化技巧

    本文旨在解决AJAX异步请求更新MySQL数据库时遇到的常见问题,特别是当直接访问PHP文件有效而通过AJAX调用却失败的情况。我们将深入探讨前端HTML结构、JavaScript事件处理的优化,并强调后端PHP使用预处理语句进行数据库操作的安全性与重要性,旨在提供一套健壮、高效且安全的解决方案。 …

    2025年12月11日
    000
  • AJAX与MySQL安全更新实践:利用PHP预处理语句和Fetch API

    本文深入探讨了如何通过AJAX请求安全高效地更新MySQL数据库。我们将重点介绍利用PHP预处理语句防范SQL注入,采用现代JavaScript Fetch API进行异步通信,以及优化前端事件处理机制,确保数据操作的安全性、可靠性与代码的可维护性。通过本教程,读者将掌握构建健壮Web应用的关键技术…

    2025年12月11日
    000
  • PHP导入CSV数据至MySQL:空值处理策略与实践

    本教程旨在解决PHP从CSV文件导入数据至MySQL数据库时,因CSV中存在空值导致SQL插入失败的问题。我们将详细介绍如何利用PHP的条件判断机制,在数据插入前自动识别并填充空字段,确保不同数据类型(如整数和字符串)的字段都能被正确处理,从而实现数据平滑导入,避免手动修改CSV文件的繁琐。 问题背…

    2025年12月11日
    000
  • 如何在PHPMyAdmin中设置访问日志记录

    phpmyadmin本身没有内置的访问日志功能,但可以通过mysql通用查询日志和web服务器日志实现操作追踪。1. 通过启用mysql的通用查询日志(general query log),可记录所有通过phpmyadmin执行的sql语句,包括用户执行的具体操作;2. web服务器(如apache…

    2025年12月11日 好文分享
    000
  • 合并数组并保留键名的实用技巧

    本文旨在介绍如何高效地合并一个包含多个子数组的数组,并保留每个子数组的键名,最终得到一个包含所有键值对的单一数组。我们将探讨一种简单易懂的实现方法,并解释其背后的逻辑,帮助你更好地理解和应用数组合并技巧。 在PHP中,有时我们需要将一个包含多个子数组的数组合并成一个单一数组,并且要保留每个子数组中的…

    2025年12月11日
    000
  • PDO 中如何正确绑定和获取不同值,以实现类似 mysqli 的功能?

    本文将介绍在使用 PHP PDO 进行数据库操作时,如何正确地绑定参数和获取结果,以实现类似 mysqli 中 bind_result 的功能。在从 mysqli 迁移到 PDO 时,很多开发者会遇到如何获取查询结果的问题,因为 PDO 并没有直接对应的 bind_result 方法。本文将详细讲解…

    2025年12月11日
    000
  • PDO 中绑定不同值的正确方法(等效于 mysqli)

    本文旨在帮助开发者理解如何在 PHP 的 PDO (PHP Data Objects) 扩展中,以一种等效于 mysqli 的方式绑定和获取查询结果。通过示例代码,详细讲解了如何使用 PDO::FETCH_ASSOC 从查询结果中提取数据,并避免不必要的参数绑定,从而简化代码并提高可读性。同时,提供…

    2025年12月11日
    000
  • PDO 中如何正确绑定和获取查询结果?

    本文旨在帮助开发者理解如何在 PHP 的 PDO (PHP Data Objects) 扩展中,正确地绑定参数并获取查询结果,特别是在从 mysqli 迁移到 PDO 时,理解两者在处理结果集上的差异至关重要。本文将通过代码示例,详细讲解 PDO 中获取数据的常用方法,并指出一些常见的误区。 在使用…

    2025年12月11日
    000
  • 解决 Laravel 与 Vue.js 应用中数据未正确显示的问题

    本文旨在帮助开发者解决在使用 Laravel 作为后端 API,Vue.js 作为前端框架构建应用时,数据无法正确显示的问题。通过分析常见的错误原因,并提供详细的代码示例和解决方案,确保数据能从 Laravel 后端成功传递到 Vue.js 前端,并正确渲染。 在使用 laravel 和 vue.j…

    2025年12月11日
    000
  • 解决 Laravel 迁移中外键重复列错误:foreignId 的正确使用

    本文探讨 Laravel 8 迁移中常见的“重复列”外键错误,该错误通常源于同时使用 unsignedBigInteger 和 foreignId 定义同一列。教程将详细解释 foreignId()->constrained() 的正确用法,指出其已包含列创建逻辑,从而避免重复定义,确保数据库…

    2025年12月11日
    000
  • jQuery Ajax提交复杂表单数据:正确处理数组元素

    本教程详细讲解如何利用jQuery Ajax高效提交包含数组结构命名(如name=”item[0][prop]”)的HTML表单数据。通过使用jQuery.serialize()方法,可将此类复杂数据自动转换为标准的URL编码格式,确保服务器端(如PHP的$_POST超全局变…

    2025年12月11日
    000
  • Laravel迁移中外键重复列错误解决方案:正确使用foreignId

    本文旨在解决Laravel 8迁移中添加外键时遇到的“列已存在”错误。核心问题在于同时定义unsignedBigInteger和foreignId导致列重复。教程将详细解释foreignId的正确用法,并提供规范的代码示例,确保外键创建的顺畅与高效,避免常见的迁移冲突,提升数据库结构定义的准确性。 …

    2025年12月11日
    000
  • 解决Laravel迁移中外键重复列错误:正确使用foreignId

    本文旨在解决Laravel数据库迁移中遇到的外键重复列错误。当使用php artisan migrate:fresh时,若同时显式定义列类型(如unsignedBigInteger)又使用foreignId方法创建外键,会导致Duplicate column name错误。核心解决方案是理解fore…

    2025年12月11日
    000

发表回复

登录后才能评论
关注微信