如何在CodeIgniter中实现高效的去重批量插入

程序猿 • 2025年12月11日 04:45:41 • 好文分享 • 阅读 2

本文旨在指导用户在CodeIgniter框架中处理批量数据导入时遇到的重复条目问题。通过深入探讨SQL的ON DUPLICATE KEY UPDATE语句，并结合CodeIgniter的查询构建器功能，我们将演示如何生成并执行自定义SQL，从而实现智能地插入新数据并跳过或更新现有重复数据，确保数据库的完整性和效率。

1. 导入数据时重复条目的挑战

在web应用开发中，从外部文件（如excel）导入大量数据到数据库是一个常见需求。然而，在多次导入同一文件或包含部分重复数据的文件时，如何避免在数据库中产生重复记录成为了一个关键问题。简单的insert_batch操作会不加区分地插入所有数据，导致数据冗余和不一致。

考虑以下场景：您有一个用于导入Excel数据的CodeIgniter控制器方法，它读取Excel文件并将数据批量插入到excel_files表中。

public function import_excel(){    if (!$_FILES["file"]["name"]) {        echo "Please upload excel file !";    } else {        $path = $_FILES["file"]["tmp_name"];        $object = PHPExcel_IOFactory::load($path);        foreach ($object->getWorksheetIterator() as $worksheet) {            $highestRow = $worksheet->getHighestRow();            $highestColumn = $worksheet->getHighestColumn();            for ($row = 2; $row getCellByColumnAndRow(1, $row)->getValue();                $email = $worksheet->getCellByColumnAndRow(2, $row)->getValue();                $address = $worksheet->getCellByColumnAndRow(3, $row)->getValue();                $contact_no = $worksheet->getCellByColumnAndRow(4, $row)->getValue();                $data[] = array(                    'username' => $username,                    'email' => $email,                    'address' => $address,                    'contact_no' => $contact_no,                );            }        }        // 这里的 insert_batch 会直接插入，不检查重复        $this->db->insert_batch('excel_files', $data);    }}

这段代码能够成功导入数据，但如果第二次导入包含相同email地址的记录，数据库中将出现重复条目。为了解决这个问题，我们需要一种机制来识别并处理重复数据。

2. 核心解决方案：SQL 的 ON DUPLICATE KEY UPDATE

MySQL提供了一个强大的SQL语句扩展：INSERT … ON DUPLICATE KEY UPDATE …。这个语句允许您在尝试插入数据时，如果遇到与现有唯一索引（包括主键）冲突的记录，则不执行插入操作，而是转而执行一个UPDATE操作。

2.1. 工作原理

当您执行一个INSERT语句，并且该语句尝试插入的行会导致某个UNIQUE索引（或PRIMARY KEY）的重复值时，ON DUPLICATE KEY UPDATE子句就会被激活。此时，它会根据指定的UPDATE逻辑来修改已存在的冲突行，而不是抛出错误或插入新行。

2.2. 前提条件：唯一索引

ON DUPLICATE KEY UPDATE的工作前提是目标表上必须存在一个或多个UNIQUE索引（或主键）。这些索引用于数据库识别“重复”的定义。例如，如果希望根据email字段判断是否重复，那么email字段必须被定义为UNIQUE。

示例：为 email 字段添加唯一索引

ALTER TABLE `excel_files` ADD UNIQUE INDEX `idx_unique_email` (`email`);

或者在创建表时定义：

CREATE TABLE `excel_files` (    `id` INT AUTO_INCREMENT PRIMARY KEY,    `username` VARCHAR(255),    `email` VARCHAR(255) UNIQUE, -- 定义为唯一    `address` VARCHAR(255),    `contact_no` VARCHAR(20));

3. 在 CodeIgniter 中实现数据去重批量插入

CodeIgniter 3 的查询构建器本身没有直接提供insert_batch与ON DUPLICATE KEY UPDATE结合的方法（即没有内置的”upsert_batch”功能）。然而，我们可以通过一些技巧来生成并执行包含ON DUPLICATE KEY UPDATE子句的批量插入SQL语句。

3.1. CodeIgniter insert_batch 的局限性

$this->db->insert_batch(‘table_name’, $data); 语句仅执行简单的批量插入。如果遇到唯一键冲突，它会根据数据库配置抛出错误（例如，MySQL会返回一个Duplicate entry错误），而不是更新现有记录。

3.2. 利用 get_compiled_insert 构建自定义 SQL

CodeIgniter 的查询构建器允许您在不实际执行查询的情况下，获取生成的SQL字符串。这正是我们需要的，我们可以先让CI生成基础的INSERT BATCH语句，然后手动在其末尾追加ON DUPLICATE KEY UPDATE子句。

步骤：

使用$this->db->set_insert_batch($data)准备批量插入数据。调用$this->db->get_compiled_insert(‘table_name’)获取编译后的INSERT BATCH SQL字符串。手动拼接ON DUPLICATE KEY UPDATE子句到获取的SQL字符串末尾。使用$this->db->query($sql)执行完整的SQL语句。

3.3. 示例代码

以下是修改后的import_excel方法，它将利用ON DUPLICATE KEY UPDATE实现去重批量插入：

load->database(); // 确保数据库已加载        $this->load->helper('url'); // 如果需要URL辅助函数        // 确保你的PHPExcel库已正确集成，例如通过Composer或手动加载        // require_once APPPATH . 'third_party/PHPExcel/Classes/PHPExcel/IOFactory.php';    }    public function import_excel_with_deduplication() {        if (!$_FILES["file"]["name"]) {            echo "请上传Excel文件！";            return;        }        $path = $_FILES["file"]["tmp_name"];        try {            $object = PHPExcel_IOFactory::load($path);        } catch (Exception $e) {            echo "加载Excel文件失败: " . $e->getMessage();            return;        }        $data_to_insert = [];        foreach ($object->getWorksheetIterator() as $worksheet) {            $highestRow = $worksheet->getHighestRow();            // 假设第一行是标题，从第二行开始读取数据            for ($row = 2; $row getCellByColumnAndRow(1, $row)->getValue();                $email = $worksheet->getCellByColumnAndRow(2, $row)->getValue();                $address = $worksheet->getCellByColumnAndRow(3, $row)->getValue();                $contact_no = $worksheet->getCellByColumnAndRow(4, $row)->getValue();                // 简单的非空检查，根据实际需求调整                if (!empty($email)) {                    $data_to_insert[] = array(                        'username' => $username,                        'email' => $email,                        'address' => $address,                        'contact_no' => $contact_no,                    );                }            }        }        if (empty($data_to_insert)) {            echo "Excel文件中没有可导入的数据。";            return;        }        // 1. 准备批量插入数据        $this->db->set_insert_batch($data_to_insert);        // 2. 获取编译后的 INSERT BATCH SQL        $sql = $this->db->get_compiled_insert('excel_files');        // 3. 拼接 ON DUPLICATE KEY UPDATE 子句        // 假设 'email' 是唯一键。当email重复时，我们更新username, address, contact_no。        // 注意：这里需要根据实际需求决定更新哪些字段。        // 如果不想更新任何字段，可以使用 `id` = `id` 的技巧。        $sql .= " ON DUPLICATE KEY UPDATE "              . "username = VALUES(username), "              . "address = VALUES(address), "              . "contact_no = VALUES(contact_no)";              // VALUES() 函数用于引用当前 INSERT 语句中为该列指定的值。        // 4. 执行完整的SQL语句        if ($this->db->query($sql)) {            echo "数据导入成功，重复条目已处理。";        } else {            echo "数据导入失败: " . $this->db->error()['message'];        }    }}

3.4. ON DUPLICATE KEY UPDATE 策略选择

在ON DUPLICATE KEY UPDATE子句中，您可以根据业务逻辑选择不同的更新策略：

更新所有相关字段： 如示例所示，当检测到重复时，更新除了唯一键之外的其他字段。

ON DUPLICATE KEY UPDATE    username = VALUES(username),    address = VALUES(address),    contact_no = VALUES(contact_no)

仅更新特定字段（例如，更新时间戳）： 如果您只想记录重复发生的时间，而不改变其他数据。

ON DUPLICATE KEY UPDATE    last_updated_at = NOW()

不更新任何字段（“ID Trick”）： 如果您只想跳过重复项而不进行任何更新，可以利用id = id的技巧。这会使数据库执行一个无意义的更新操作，从而避免插入新行，但不会修改现有数据。

ON DUPLICATE KEY UPDATE    id = id

这种方法特别适用于只希望“插入不存在的，忽略已存在的”场景。

4. 注意事项

4.1. 确保唯一索引存在

这是ON DUPLICATE KEY UPDATE正常工作的基石。在执行代码之前，请务必确认您的数据库表上已经为用于去重的字段（例如email）创建了UNIQUE索引或将其设为主键。否则，该语句将不会按预期工作，而是可能导致错误。

4.2. 数据验证

尽管ON DUPLICATE KEY UPDATE处理了数据库层面的重复，但在将数据传递给数据库之前，进行必要的服务器端数据验证仍然至关重要。这包括检查数据类型、格式、非空约束等，以确保数据的质量和安全性。

4.3. 性能考量

对于极大规模的数据导入（例如，数十万甚至数百万条记录），虽然ON DUPLICATE KEY UPDATE比逐条查询再插入/更新效率高，但仍可能面临性能瓶颈。在这种情况下，可以考虑更高级的ETL（抽取、转换、加载）策略，例如：

将导入数据先存入一个临时表。使用SQL的INSERT INTO … SELECT … ON DUPLICATE KEY UPDATE语句从临时表批量处理到目标表。利用数据库的LOAD DATA INFILE命令（如果适用）。

总结

通过结合SQL的ON DUPLICATE KEY UPDATE语句和CodeIgniter的get_compiled_insert功能，我们能够有效地在批量数据导入时处理重复条目。这种方法既保证了数据的完整性，又提高了导入效率。关键在于理解ON DUPLICATE KEY UPDATE的机制，并确保数据库表上存在正确的唯一索引。根据实际业务需求，灵活选择ON DUPLICATE KEY UPDATE的更新策略，可以使您的数据导入流程更加健壮和智能。

以上就是如何在CodeIgniter中实现高效的去重批量插入的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1288031.html

access ai composer mysql sql语句

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

LAMP环境下PHPCMS的配置与优化

上一篇 2025年12月11日 04:45:38

PHP怎么实现数据缓存穿透防止缓存穿透的6个有效策略

下一篇 2025年12月11日 04:45:51

好文分享

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
4000
好文分享

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
8000
好文分享

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
4000
好文分享

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
好文分享

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
5000
好文分享

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
2000
好文分享

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
1000
好文分享

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
0000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
2000
好文分享

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
1000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
2000
好文分享

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
0000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
0000
好文分享

使用CSS mask属性指定图片URL时，为什么浏览器无法加载图片？

css mask属性未能加载图片的解决方法使用css mask属性指定图片url时，如示例中所示： mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是，在网络面板中却…

程序猿
2025年12月24日
0000
好文分享

如何用CSS Paint API为网页元素添加时尚的斑马线边框？

为元素添加时尚的斑马线边框在网页设计中，有时我们需要添加时尚的边框来提升元素的视觉效果。其中，斑马线边框是一种既醒目又别致的设计元素。实现斜向斑马线边框要实现斜向斑马线间隔圆环，我们可以使用css paint api。该api提供了强大的功能，可以让我们在元素上绘制复杂的图形。立即学习“前端…

程序猿
2025年12月24日
0000
好文分享

图片如何不撑高父容器？

如何让图片不撑高父容器？当父容器包含不同高度的子元素时，父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开，避免图片对其产生影响，可以通过以下 css 解决方法：绝对定位元素： .child-image { position: absolute; top: 0; left: …

程序猿
2025年12月24日
0000
CSS 帮助

我正在尝试将文本附加到棕色框的左侧。我不能。我不知道代码有什么问题。请帮助我。 css .hero { position: relative; bottom: 80px; display: flex; justify-content: left; align-items: start; color:…

程序猿
2025年12月24日 • 好文分享
2000
好文分享

前端代码辅助工具：如何选择最可靠的AI工具？

前端代码辅助工具：可靠性探讨对于前端工程师来说，在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而，并非所有工具都能提供同等的可靠性。个性化需求关于哪个AI工具最可靠，这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素：立…

程序猿
2025年12月24日
0000
好文分享

如何用 CSS Paint API 实现倾斜的斑马线间隔圆环？

实现斑马线边框样式：探究 css paint api 本文将探究如何使用 css paint api 实现倾斜的斑马线间隔圆环。问题：给定一个有多个圆圈组成的斑马线图案，如何使用 css 实现倾斜的斑马线间隔圆环？答案：立即学习“前端免费学习笔记（深入）”；使用 css paint api…

程序猿
2025年12月24日
0000
好文分享

如何使用CSS Paint API实现倾斜斑马线间隔圆环边框？

css实现斑马线边框样式想定制一个带有倾斜斑马线间隔圆环的边框？现在使用css paint api，定制任何样式都轻而易举。 css paint api 这是一个新的css特性，允许开发人员创建自定义形状和图案，其中包括斑马线样式。立即学习“前端免费学习笔记（深入）”；实现倾斜斑马线间隔圆环 …

程序猿
2025年12月24日
1000