Yii2中JSON数据批量导入MySQL的性能优化实践

Yii2中JSON数据批量导入MySQL的性能优化实践

本文深入探讨了在yii2框架下从json文件批量导入数据到mysql时遇到的性能瓶颈及优化策略。通过对比activerecord的save()方法与db命令的insert()及batchinsert(),并结合预加载关联数据,显著提升了导入效率。文章提供了详细的代码示例和注意事项,旨在帮助开发者高效处理大规模数据导入任务。

引言:理解批量数据导入的性能瓶颈

在Web应用开发中,尤其是在数据同步或初始化场景下,我们常需要将大量数据从文件(如JSON)导入到数据库。然而,如果不采用正确的策略,这一过程可能会非常耗时。原始代码中,开发者使用Yii2 ActiveRecord的save()方法在循环中逐条插入数据,导致了显著的性能下降。例如,导入数百条记录的时间会从几秒迅速增长到几十秒甚至更长,对于数万甚至百万级别的数据量,这种方法是不可接受的。

save()方法虽然方便,但它为每个模型实例执行了多项操作:实例化模型、数据验证、触发事件回调、以及最终执行一条独立的SQL INSERT 或 UPDATE 语句。当这些操作在循环中针对大量记录重复执行时,其累积的开销(包括PHP层面的处理和与数据库的多次往返通信)将成为严重的性能瓶颈。

考虑以下原始实现的核心逻辑:

foreach ($products as $product) {    $item = new Product_dub();    // ... 赋值属性 ...    $category = Category_dub::findOne(['id_1c_category' => $product->category_id]); // 每次循环查询    $brand = Brands_dub::findOne(['id_1c_brand' => $product->brand_id]); // 每次循环查询    // ... 赋值关联ID ...    if (!$item->save()) { // 每次循环执行一次INSERT        // ... 错误处理 ...    }}

从上述代码可以看出,除了每次循环进行两次数据库查询来获取category和brand之外,最主要的性能消耗在于$item->save()。即使移除了findOne()查询,save()本身的开销依然巨大。

优化策略一:从ActiveRecord save() 到DB命令 insert()

解决save()性能问题的首要步骤是绕过ActiveRecord的全部生命周期,直接使用Yii2的数据库命令执行INSERT操作。Yii2的Yii::$app->db->createCommand()->insert()方法允许我们直接构建并执行SQL插入语句,极大地减少了框架层面的开销。

通过将$item->save()替换为insert()命令,性能得到了显著提升。例如,在测试中,1107行数据导入时间从最初的数分钟缩短到约40秒。

以下是使用insert()命令进行优化的示例:

foreach ($products as $product) {    Yii::$app->db->createCommand()->insert('product_dub', [        'id_1c_product' => $product->id,        // ... 其他属性 ...        'category_id' => $categoryMap[$product->category_id] ?? '0', // 假设categoryMap已预加载        'brand_id' => $brandMap[$product->brand_id] ?? 'No brand',   // 假设brandMap已预加载        // ...    ])->execute();}

这种方法虽然仍是循环中逐条插入,但每次循环仅执行一次SQL INSERT 命令,避免了ActiveRecord的验证、事件等额外处理,从而显著提高了效率。

优化策略二:预加载关联数据以减少查询次数

在原始代码中,Category_dub::findOne()和Brands_dub::findOne()在每次循环中都会执行一次数据库查询,以根据外部ID查找内部ID。对于N条记录,这将导致2N次额外的数据库查询,这就是典型的N+1查询问题,进一步拖慢了导入速度。

为了消除这些重复查询,我们应该在导入循环开始之前,一次性地从数据库中加载所有必要的关联数据,并将其存储在内存中的映射(Map)结构中。这样,在循环内部,我们只需进行内存查找,而非数据库查询。

以下是预加载分类和品牌数据的示例:

$categoryMap = Category_dub::find()->select(['id', 'id_1c_category'])->indexBy('id_1c_category')->column();$brandMap = Brands_dub::find()->select(['id', 'id_1c_brand'])->indexBy('id_1c_brand')->column();foreach ($products as $product) {    Yii::$app->db->createCommand()->insert('product_dub', [        'id_1c_product' => $product->id,        'category_id' => $categoryMap[$product->category_id] ?? '0', // 从内存映射中获取        'title' => $product->title,        'brand_id' => $brandMap[$product->brand_id] ?? 'No brand',   // 从内存映射中获取        'content1' => $product->content1,        'content2' => $product->content2,        'content3' => $product->content3,        'link_order' => $product->link_order,        'img' => $product->img ?? 'no-image.png',        'in_stock' => $product->in_stock ? 1 : 0,        'is_popular' => $product->is_popular ? 1 : 0,    ])->execute();}

通过结合insert()命令和预加载关联数据,我们可以看到一个完整的、大幅优化后的导入逻辑。

更进一步的性能提升:使用 batchInsert()

尽管insert()命令比save()快得多,但它仍然是循环中逐条执行SQL语句。对于处理数万甚至百万级别的数据,最佳实践是使用Yii2提供的batchInsert()方法。batchInsert()能够生成一条包含多行数据的INSERT SQL语句,一次性将多条记录发送到数据库,从而显著减少了与数据库的通信次数,进一步提升了性能。

batchInsert()方法的参数包括表名、列名数组和值数组(每个元素代表一行数据)。

public function importProductFile($file, $return = true){        $products = json_decode($file, true); // 解码为关联数组更方便    $dubTableName = Product::tableName() . "_dub";    $start = time();    if ($this->db->createDuplicateTable(Product::tableName(), $dubTableName)) {        $categoryMap = Category_dub::find()->select(['id', 'id_1c_category'])->indexBy('id_1c_category')->column();        $brandMap = Brands_dub::find()->select(['id', 'id_1c_brand'])->indexBy('id_1c_brand')->column();        $rows = [];        foreach ($products as $product) {            $rows[] = [                'id_1c_product' => $product['id'],                'category_id' => $categoryMap[$product['category_id']] ?? '0',                'title' => $product['title'],                'brand_id' => $brandMap[$product['brand_id']] ?? 'No brand',                'content1' => $product['content1'],                'content2' => $product['content2'],                'content3' => $product['content3'],                'link_order' => $product['link_order'],                'img' => $product['img'] ?? 'no-image.png',                'in_stock' => $product['in_stock'] ? 1 : 0,                'is_popular' => $product['is_popular'] ? 1 : 0,            ];        }        // 批量插入数据        if (!empty($rows)) {            Yii::$app->db->createCommand()->batchInsert('product_dub', array_keys($rows[0]), $rows)->execute();        }    }    $finish = time();    $res = $finish - $start . "sec. ";    if ($return) {        echo $res;        Answer::success();    }}

高级优化与注意事项

除了上述代码层面的优化,还有一些其他因素可以影响批量导入

以上就是Yii2中JSON数据批量导入MySQL的性能优化实践的详细内容,更多请关注php中文网其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1331310.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月12日 17:23:20
下一篇 2025年12月12日 17:23:34

相关推荐

  • PHP preg_match 技巧:高效提取方括号内带分隔符的特定内容

    本文详细介绍了如何使用 php 的 `preg_match` 函数结合正则表达式,从包含方括号且内部由管道符分隔的字符串中,精确提取出所需的多个独立内容。通过一个具体的示例,文章解析了关键正则表达式的构成、捕获组的使用以及 php 代码的实现细节,旨在帮助开发者高效处理类似文本解析任务。 在日常的字…

    2025年12月12日
    000
  • 在 PrestaShop 后台品牌页面添加自定义字段

    本文旨在指导开发者如何在 PrestaShop 后台的品牌(制造商)页面添加自定义字段。通过 `hookActionManufacturerFormBuilderModifier` 钩子,您可以轻松扩展品牌信息,实现更灵活的数据管理。本文将详细介绍具体步骤,并提供示例代码,帮助您快速掌握该技巧。 P…

    2025年12月12日
    000
  • 如何通过PHP调用远程服务健康检查接口_PHP远程服务健康检查接口(如HTTP探针)调用教程

    可通过file_get_contents、cURL、Guzzle三种方式用PHP调用远程健康检查接口;2. file_get_contents适用于简单GET请求,配合stream_context_create设置超时;3. cURL支持更精细控制,如超时、头部设置,并通过curl_getinfo验…

    2025年12月12日
    000
  • 优化Laravel测验结果计算:避免For循环中的数组索引陷阱

    本文深入探讨了laravel控制器中计算测验结果时for循环可能遇到的数组索引问题。当用户提交的答案数组与题目id数组的索引方式不一致时,会导致循环逻辑错误,从而无法正确统计得分。文章通过分析问题根源,提供了一种精确匹配用户答案与正确答案的解决方案,确保测验结果计算的准确性,并强调了数组索引一致性的…

    2025年12月12日
    000
  • 解决XAMPP端口占用问题:诊断、识别与处理

    当xampp因端口(如8080)被占用而无法启动时,即使没有xampp窗口运行,这通常意味着有其他程序正在使用该端口。本教程将指导您如何利用系统命令(如netstat)精确识别占用端口的进程,并提供有效的终止方法,确保xampp能够顺利启动,避免常见的服务冲突。 诊断端口占用:识别冲突进程 XAMP…

    2025年12月12日
    000
  • php项目怎么部署到国外服务器_php项目国外服务器部署步骤与网络优化教程

    选择合适国外服务器并配置LAMP/LNMP环境,完成域名解析与HTTPS部署,迁移数据库并优化网络访问,提升PHP项目性能与安全性。 将PHP项目部署到国外服务器并不复杂,但需要关注环境配置、安全设置和网络访问优化。以下是完整的部署流程与提升访问速度的实用建议。 一、选择合适的国外服务器 部署前先根…

    2025年12月12日
    000
  • 深入理解 mysqli 风格转换与现代数据库操作实践

    本文深入探讨了 `mysqli` 数据库扩展中对象式与过程式两种编程风格的转换与应用,并指出对象式 `mysqli` 并非真正的面向对象编程,但仍是推荐的现代实践。文章通过具体代码示例演示了如何将对象式 `mysqli` 转换为过程式,并剖析了常见错误。同时,强烈建议采用 pdo 或简化版对象式 `…

    2025年12月12日
    000
  • 深入理解 PHP 配置:php.ini 与 .user.ini 的异同与应用

    本文旨在详细解析 php 配置中 `php.ini` 和 `.user.ini` 文件的关键区别、作用范围及其适用场景。我们将探讨 `php.ini` 作为全局配置的特性,以及 `.user.ini` 如何在特定目录下实现配置覆盖,并强调其在 php-fpm/fastcgi 环境下的依赖性,同时提供…

    2025年12月12日
    000
  • 简化PHP条件判断:优化复杂If语句的实践

    本文旨在探讨PHP中复杂条件逻辑的简化策略,通过分析一个具体的if-elseif结构案例,展示如何将其重构为更简洁、易读且易于维护的形式。我们将深入理解原始代码的意图,对比简化后的逻辑,并强调在重构过程中验证业务需求的重要性,以确保代码优化在提升可读性的同时,不改变原有功能。 在软件开发中,条件判断…

    2025年12月12日
    000
  • 将HTML内容作为纯文本代码展示的PHP教程

    本教程详细介绍了如何使用php将html文件内容读取出来,并将其作为纯文本(即代码形式)在网页或邮件中展示。核心方法是利用`htmlspecialchars()`函数对html实体进行转义,并结合`preg_replace()`将换行符转换为html的“标签,从而确保原始代码结构和格式的正确呈现。…

    2025年12月12日
    000
  • 在Laravel中利用MySQL通配符实现含连字符/空格的灵活搜索

    本文介绍如何在laravel应用中,利用mysql的`_`通配符,实现对包含连字符或空格的商品名称进行灵活且不区分大小写的搜索。通过将用户输入的搜索词中的连字符和空格替换为`_`通配符,可以有效地匹配数据库中格式多样的记录,避免常见的语法错误,提升搜索的健壮性。 在开发Web应用时,我们经常需要实现…

    2025年12月12日
    000
  • 使用FPDI在PHP中合并PDF并智能适配页面尺寸与方向

    本教程详细阐述了如何在php中利用fpdi库合并多个pdf文件,并解决因源文件页面尺寸或方向不一致导致的裁剪问题。通过动态获取每个导入页面的尺寸和方向信息,fpdi能够智能地为新页面设置正确的布局,确保所有内容完整无损地呈现,从而实现高效且兼容性强的pdf合并操作。 引言 在Web应用开发中,经常会…

    2025年12月12日
    000
  • MySQL中特殊字符编码的最佳实践:为什么选择utf8mb4

    在MySQL数据库处理包含特殊字符的数据时,选择正确的字符编码至关重要,否则可能导致数据乱码或查询失败。本文将深入探讨处理 `éšš+á` 等特殊字符的挑战,比较不同字符集的兼容性,并强烈推荐使用 `utf8mb4` 作为全面支持多语言和特殊符号的最佳解决方案,同时提供配置指南。 理解MySQL字符…

    2025年12月12日
    000
  • 解决Laravel项目在GitHub上仅显示README文件的指南

    本教程旨在解决Laravel项目推送到GitHub后,仅显示`README.md`文件而项目目录缺失的问题。文章将详细解释导致此问题的常见原因,并提供一套标准的Git命令流程,包括`git add .`、`git commit`和`git push -f`,以确保所有必要的项目文件都能正确上传并显示…

    2025年12月12日
    000
  • 使用PHP自动化SFTP文件下载:基于SSH密钥认证的实践指南

    本文详细介绍了如何在php环境中,利用ssh密钥认证自动化sftp文件下载。针对传统`ssh2`扩展连接失败和`passthru`多命令执行的挑战,文章提供了一个简洁高效的单行sftp命令解决方案,通过直接指定源文件路径实现文件传输,并探讨了其工作原理、注意事项及适用场景,帮助开发者快速实现sftp…

    2025年12月12日
    000
  • PHP中精确查找逗号分隔字符串中的数字:避免子字符串匹配陷阱

    本文详细阐述了在php中如何准确判断逗号分隔字符串中是否包含特定数字,而非其子串。针对`strpos`可能导致的误判,教程介绍了使用`explode`函数将字符串拆分为数组,再结合`in_array`函数进行精确匹配的解决方案,确保在处理此类数据时获得准确可靠的查找结果。 在PHP开发中,我们经常需…

    2025年12月12日
    000
  • Laravel调度器:实现季度任务的提前执行策略

    本文深入探讨了如何在Laravel命令调度器中实现季度任务的提前执行。虽然Laravel的`quarterly()`方法默认在季度首日运行,但通过灵活运用`cron()`方法,可以精确或近似地将任务调度到季度开始前的一周,以满足特定业务需求,并提供了应对月份天数差异的策略。 在Laravel应用开发…

    2025年12月12日
    000
  • 使用PHP和MySQL高效查询最频繁数据项的教程

    本教程详细介绍了如何利用php和mysql高效地查询并展示数据库中某一列出现频率最高的数据项。文章重点讲解了sql的`count()`和`group by`聚合函数,以及在php中执行查询、处理结果和进行关键错误处理的最佳实践,确保数据检索的准确性和代码的健壮性。 在数据驱动的应用程序中,经常需要识…

    2025年12月12日
    000
  • 在 cPanel 应用管理器中通过 PHP 访问环境变量的实用指南

    本文详细介绍了如何在 cpanel 应用管理器中设置的环境变量通过 php 程序进行访问。教程涵盖了 `$_env`、`getenv()` 和 `$_server` 三种主要的 php 方法,并提供了相应的代码示例和使用注意事项,旨在帮助开发者在共享主机环境中安全、高效地管理应用配置,确保变量的正确…

    2025年12月12日
    000
  • PHP模板怎么组件复用_PHP模板组件复用方法及模块化开发。

    通过组件复用可提升PHP模板开发效率与可维护性,常用方式包括:一、使用include/require引入公共文件实现结构分离;二、封装函数动态渲染组件并集中管理;三、采用Twig等模板引擎利用继承与宏定义高级特性;四、以类和对象组织模块,实现高内聚低耦合设计。 在进行PHP模板开发时,若需要在多个页…

    2025年12月12日
    000

发表回复

登录后才能评论
关注微信