在ThinkPHP6中使用Mysql进行大批量数据导入

随着数据量不断增加,许多企业需要将大量数据导入到数据库中。但是对于开发人员来说,如何高效地进行数据导入,却是一个值得探讨的问题。在本文中,我们将介绍如何在thinkphp6框架中使用mysql进行大批量数据导入。

准备数据

在开始导入之前,我们需要准备好数据。数据可以以CSV、Excel等格式导出,也可以直接由代码生成。在本文中,我们将使用代码生成数据。

先来创建一个数据表user

CREATE TABLE `user` (  `id` int(11) NOT NULL AUTO_INCREMENT,  `name` varchar(255) DEFAULT NULL,  `age` int(11) DEFAULT NULL,  `created_at` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,  `updated_at` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,  PRIMARY KEY (`id`)) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4;

然后编写以下代码生成1000条数据:

use thinkacadeDb;// 生成测试数据$data = [];for ($i = 1; $i  'User' . $i,        'age' => mt_rand(18, 60),    ];}// 批量插入数据Db::name('user')->insertAll($data);

使用Mysql的LOAD DATA功能导入数据

Mysql提供了一个非常方便的功能LOAD DATA,可以将数据从文件导入到表中。我们只需要将数据保存到一个CSV文件中,然后使用LOAD DATA命令将数据导入到表中。

立即学习“PHP免费学习笔记(深入)”;

首先,将所有数据保存到CSV文件中。在本例中,我们将数据保存到user.csv文件中:

use thinkacadeDb;$data = Db::name('user')->select();$fp = fopen('user.csv', 'w');//写数据到CSV文件中foreach ($data as $item) {    fputcsv($fp, [$item['name'], $item['age']]);}fclose($fp);

然后使用以下代码将数据导入到数据库中:

use thinkacadeDb;$filename = 'user.csv';$sql = <<<EOF    LOAD DATA LOCAL INFILE '{$filename}'     INTO TABLE `user` CHARACTER SET utf8mb4 FIELDS TERMINATED BY ',' ENCLOSED BY '"' LINES TERMINATED BY ''     (`name`, `age`)EOF;Db::query($sql);

在上述代码中,我们首先指定要导入的文件路径,然后编写SQL语句,使用LOAD DATA将数据导入到数据库中。需要注意的是,在导入之前需要确保Mysql的local_infile选项已经开启。

使用TP6自带的批量插入功能导入数据

Mysql的LOAD DATA功能虽然方便快捷,但是需要将数据保存为文件,而且需要手动编写SQL语句,操作起来较为繁琐。在TP6中,我们可以使用自带的批量插入功能,一次性插入大量数据。

在上面的例子中,我们使用以下代码将数据插入到数据库中:

use thinkacadeDb;$data = Db::name('user')->select();$result = Db::name('user')->insertAll($data);

在上述代码中,我们首先查询所有数据,然后使用insertAll方法批量插入数据。需要注意的是,insertAll方法默认一次性最多插入1000条数据。如果要插入更多数据,需要在insertAll方法中指定$limit参数。例如,以下代码将每次最多插入500条数据:

use thinkacadeDb;$data = Db::name('user')->select();$limit = 500;$total = count($data);for ($i = 0; $i insertAll(array_slice($data, $i, $limit));}

在上述代码中,我们使用循环的方式将数据分批插入。每次最多插入500条数据,直到全部完成。

总结:

在ThinkPHP6中进行大批量数据导入,可能会遇到内存溢出、性能瓶颈等问题,但是通过使用Mysql的LOAD DATA功能、TP6自带的批量插入功能、手动分批插入数据等方法,可以有效提高数据导入的效率。在实际开发过程中,需要根据情况选择合适的方法,以达到最优的导入效果。

以上就是在ThinkPHP6中使用Mysql进行大批量数据导入的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/190986.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月1日 13:08:41
下一篇 2025年11月1日 13:09:46

相关推荐

  • Pandas与SQL数据库:高效更新表列的实践指南

    本教程详细介绍了如何使用Pandas DataFrame中的新值更新SQL数据库表的指定列。文章首先展示了通过迭代DataFrame行进行逐行更新的方法,该方法适用于小规模数据但对大数据集效率低下。随后,重点介绍了利用Pandas to_sql功能结合SQL临时表进行批量更新的高效策略,这对于处理大…

    2025年12月14日
    000
  • 使用 Python 连接 AWS MySQL 数据库的教程

    本文旨在帮助开发者解决在使用 Python 连接 AWS RDS MySQL 数据库时遇到的常见问题。通过配置 VPC 网络、安全组规则以及检查连接参数,确保 Python 代码能够成功连接到数据库。文章将提供示例代码和详细步骤,帮助读者快速排除连接故障。 前提条件 在开始之前,请确保你已经完成了以…

    2025年12月14日
    000
  • 解决Flask应用启动时SQLAlchemy无法连接MySQL服务器的问题

    本文旨在解决Flask应用在启动或重启后,SQLAlchemy无法立即与MySQL服务器建立连接的问题。通过分析常见的错误信息和提供相应的解决方案,帮助开发者避免因数据库连接问题导致的应用启动异常,确保应用的稳定运行。主要介绍使用Engine.dispose()和uwsgidecorators.po…

    2025年12月14日
    000
  • 创建Discord等级系统并从MEE6迁移数据

    本文档旨在指导开发者如何创建一个自定义的Discord等级系统,并从现有的MEE6等级系统中迁移数据。通过公开MEE6的排行榜数据,我们可以使用Python脚本访问并提取玩家的等级信息,进而为新的等级系统提供初始数据。本文将详细介绍如何公开MEE6排行榜、使用Python脚本获取数据,并提供代码示例…

    2025年12月14日
    000
  • Django多项目共享模型:通用数据库配置与管理策略

    本教程探讨了在多个Django项目之间高效共享特定模型数据(如Word模型)的策略。通过在settings.py中配置多个数据库,并结合.using()方法或自定义模型管理器,可以使不同项目访问同一个通用数据库,从而避免重复数据传输和管理,实现数据的集中化存储和访问。 引言 在企业级应用开发中,我们…

    2025年12月14日
    000
  • Django多项目共享模型数据:基于独立数据库的解决方案

    本教程旨在解决多个Django项目间高效共享特定模型(如“Word”模型)数据的问题。针对传统导入导出方式效率低下的痛点,文章详细介绍了如何在Django中配置和使用独立的共享数据库,并通过自定义模型管理器简化对共享数据的访问。同时,也探讨了跨数据库操作的限制以及如何在共享数据库中实现项目数据隔离的…

    2025年12月14日
    000
  • Django多项目共享模型数据:实现通用数据库的策略

    在多个Django项目需要共享特定模型(如Word模型)的数据时,传统的数据导入导出方式效率低下。本文将介绍如何通过配置Django的多数据库功能,为特定模型(如Word)创建一个所有项目均可访问的通用数据库。我们将详细讲解如何在settings.py中定义多数据库连接,以及如何通过using()方…

    2025年12月14日
    000
  • 在多个Django项目中高效共享通用数据库模型的策略

    本教程探讨了在多个Django项目中高效共享通用模型数据的方法,尤其适用于处理大量数据传输的场景。通过配置多数据库连接和实现自定义模型管理器,可以使不同项目无缝访问和管理共享模型,显著提升数据同步效率。文章详细介绍了配置步骤、代码示例及潜在限制。 引言:多项目环境下的模型共享挑战 在复杂的应用架构中…

    2025年12月14日
    000
  • 解决Docker化Flask应用中SQLite数据库无法打开的问题

    在Docker容器中运行Flask应用时,常见的sqlite3.OperationalError: unable to open database file错误通常源于文件路径配置不当或容器间数据共享机制缺失。本文将详细探讨此问题产生的原因,并提供两种解决方案:一是修正应用内部的文件路径逻辑,二是通…

    2025年12月14日
    000
  • Docker环境下Flask应用访问SQLite数据库文件路径错误解决方案

    本文旨在解决Docker化Flask应用中常见的sqlite3.OperationalError: unable to open database file错误。该问题通常源于容器内部文件路径的误解或数据持久化配置不当。文章将详细分析错误成因,并提供两种主要解决方案:首先是修正容器内部的数据库文件路…

    2025年12月14日
    000
  • Python DataFrame高效写入SQL分区表的策略

    当使用pandas.DataFrame.to_sql方法向SQL分区表插入数据时,常因未指定分区列而遇到错误。本文提供了一种稳健的解决方案:首先将DataFrame数据暂存至一个非分区临时表,随后通过执行SQL INSERT OVERWRITE语句,将临时表中的数据连同指定的分区信息一并导入到目标分…

    2025年12月14日
    000
  • PyCharm 专业版与社区版如何选择

    PyCharm专业版功能更全,适合Web开发、数据科学及团队协作;社区版免费轻量,适合初学者和基础开发。根据需求选择,建议先试用专业版再决定是否购买。 PyCharm 是 JetBrains 推出的 Python 集成开发环境,广受开发者欢迎。它分为 专业版(Professional) 和 社区版(…

    2025年12月14日
    000
  • Python 实战:简易 Flask 博客项目

    用Python和Flask搭建简易博客,可直观理解Web开发核心。1. 创建虚拟环境并安装Flask、Flask-SQLAlchemy等库;2. 编写app.py定义应用实例、数据库模型(Post)、表单(PostForm)及路由(首页、文章详情、创建文章);3. 使用Jinja2模板引擎构建bas…

    2025年12月14日
    000
  • 解决Django迁移中“表已存在”错误的排查与修复

    本文旨在详细解析Django项目迁移过程中常见的“Table already exists”错误,分析其发生原因,并提供一套系统化的排查与修复方案。核心解决策略聚焦于通过管理django_migrations表来同步数据库与Django的迁移历史,确保项目能够顺利执行数据库迁移操作。 理解“表已存在…

    2025年12月14日
    000
  • 解决Django迁移中’表已存在’错误:深入解析与实践

    本文旨在解决Django项目中常见的OperationalError: Table ‘…’ already exists迁移错误。当数据库中表已存在但Django迁移记录缺失时,该错误会发生。教程将详细指导如何通过操作django_migrations表来同步数据…

    2025年12月14日
    000
  • python中怎么连接MySQL数据库_Python使用PyMySQL连接MySQL数据库教程

    答案:使用PyMySQL连接MySQL是Python中最常用且推荐的方式,因其纯Python实现、兼容性好、安装简便且支持DB-API 2.0规范。通过pymysql.connect()建立连接,配合参数化查询防止SQL注入,使用DictCursor获取字典结果,并在异常处理中确保连接关闭。实际项目…

    2025年12月14日
    000
  • 深入解析Confluence页面数据提取:API优先,数据库直连为辅

    本文旨在探讨如何从Confluence页面高效提取数据,特别是表格格式内容。我们主要介绍两种策略:推荐使用的Confluence REST API,它适用于大多数场景且易于实现;以及针对特定自托管环境和极致性能需求下考虑的数据库直连方式。文章将详细阐述两种方法的优缺点、适用场景,并提供API方式的P…

    2025年12月14日
    000
  • Confluence数据提取策略:API与数据库直连对比解析

    本文深入探讨了从Confluence页面(特别是表格数据)提取信息的两种主要策略:通过Confluence API进行访问和直接连接Confluence后端数据库。文章分析了两种方法的优缺点、适用场景及技术挑战,强调API是更推荐且简便的方案,而数据库直连则适用于特定高性能需求但技术门槛较高的场景,…

    2025年12月14日
    000
  • python中怎么实现一个定时任务?

    答案:选择定时任务方案需权衡需求复杂度与稳定性,APScheduler因支持持久化、多种调度方式及并发执行,适合生产环境。 Python实现定时任务,方法其实不少,从最简单的循环加延时,到内置的 threading.Timer 、 sched 模块,再到功能强大的第三方库如 APScheduler …

    2025年12月14日
    000
  • Python怎么执行SQL语句_数据库游标对象SQL执行方法

    先连接数据库,再创建游标执行SQL。应根据数据库类型选择Python库,如MySQL用mysql-connector-python或pymysql,PostgreSQL用psycopg2,SQLite用sqlite3。操作流程包括连接、创建游标、执行SQL、处理结果和关闭连接。为避免编码问题,需统一…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信