MySQL非规范化表数据高效提取与PHP处理教程

MySQL非规范化表数据高效提取与PHP处理教程

本教程旨在解决从mysql非规范化eav(实体-属性-值)表中高效提取和组织特定用户数据(如姓名)的问题。针对大型数据集(数万行),传统的多查询循环方式效率低下。文章将深入探讨两种优化策略:一是利用sql的条件聚合功能在数据库层面直接重构数据,实现单次查询的高效数据转换;二是采用单次全量查询结合php内存处理,灵活重组数据。教程将提供详细代码示例、性能考量及注意事项,帮助开发者在处理类似场景时实现卓越性能。

从非规范化表中高效提取与组织用户数据

在Web开发中,尤其是在使用某些内容管理系统(CMS)或第三方插件时,我们经常会遇到数据存储在非规范化的EAV(Entity-Attribute-Value,实体-属性-值)模式表中。这种模式的特点是,不同的属性值(例如用户的姓、名、地址、邮箱)都存储在同一个value列中,并通过一个field_id来标识其具体含义,而用户或实体则通过app_id等字段来唯一识别。

例如,一个典型的EAV表结构可能如下所示:

ID app_id field_id value

xxxyyy9First Namexxxyyy15Last Namezzzaaa9Anotherzzzaaa15User

其中,app_id代表用户ID,field_id为9表示“First Name”,field_id为15表示“Last Name”。我们的目标是高效地从这张表中为每个用户提取出其姓和名,并将其组合或以结构化形式呈现。

挑战:大型数据集的性能瓶颈

当表中的数据量达到数万甚至数十万行时,传统的“为每个用户ID循环查询”或“全表查询后在PHP中进行低效嵌套循环处理”的方法将导致严重的性能问题,例如查询时间过长(10分钟以上)和服务器负载过高。因此,我们需要寻找更高效的数据提取和组织策略。

立即学习“PHP免费学习笔记(深入)”;

常见的低效方法及其问题

1. PHP中多层循环处理全量数据

初学者可能会尝试一次性查询出所有数据,然后在PHP中通过多层循环来匹配和重组数据。

$mysqli = new mysqli("localhost", "dbuser", "dbpass", "dbname");$mysqli->set_charset("utf8mb4");$fields = $mysqli->query("SELECT app_id, field_id, value FROM name_of_table");$results = $fields->fetch_all(MYSQLI_ASSOC); // 获取所有数据$users_data = [];foreach ($results as $row) {    $app_id = $row['app_id'];    $field_id = $row['field_id'];    $value = $row['value'];    if (!isset($users_data[$app_id])) {        $users_data[$app_id] = [            'first_name' => null,            'last_name' => null,        ];    }    // 根据field_id分配值    if ($field_id == 9) { // 假设9是First Name        $users_data[$app_id]['first_name'] = $value;    } elseif ($field_id == 15) { // 假设15是Last Name        $users_data[$app_id]['last_name'] = $value;    }}// 此时 $users_data 包含了所有用户的姓和名foreach ($users_data as $app_id => $data) {    echo "用户ID: " . $app_id . ", 姓: " . ($data['first_name'] ?? 'N/A') . ", 名: " . ($data['last_name'] ?? 'N/A') . "
";}$mysqli->close();

问题分析: 尽管避免了多次数据库查询,但如果数据量非常大,fetch_all()可能会占用大量内存。在PHP中处理大量数据(例如20,000行或更多)也会消耗显著的CPU资源。

2. 在循环中执行多次数据库查询

另一种常见的错误是遍历用户ID列表,并在每次迭代中执行一个数据库查询。

// 假设 $count 是最大的 app_id 或需要处理的 app_id 范围for ($i = $count; $i >= ($count - 1000); $i--) { // 循环1000次    // 每次循环都执行一次数据库查询    $data = $mysqli->query("SELECT field_id, value FROM name_of_table WHERE app_id = $i AND field_id IN (9, 15)");    $names = $data->fetch_all(MYSQLI_NUM);    $first_name = null;    $last_name = null;    foreach ($names as list($field_id, $value)) {        switch ($field_id) {            case 9:                $first_name = $value;                break;            case 15:                $last_name = $value;                break;        }    }    // 输出或存储 $first_name, $last_name    if ($first_name || $last_name) {        echo "用户ID: " . $i . ", 姓: " . ($first_name ?? 'N/A') . ", 名: " . ($last_name ?? 'N/A') . "
"; }}$mysqli->close();

问题分析: 这种方法对数据库的压力极大。每次循环都会建立新的查询连接、解析SQL、执行查询、传输结果,这些开销累积起来会非常显著。对于20,000行数据,如果需要处理数千个不同的app_id,将导致数千次数据库查询,性能将急剧下降。

高效解决方案

为了克服上述性能瓶颈,我们应该尽量减少数据库交互次数,并尽可能将数据重组的逻辑推到数据库层面或在PHP中进行高效的内存处理。

1. 方案一:SQL条件聚合(推荐)

这是最推荐的方法,它利用SQL的条件聚合功能,在数据库层面通过单次查询完成数据的“透视”或重组。

SELECT    t.app_id,    MAX(CASE WHEN t.field_id = 9 THEN t.value ELSE NULL END) AS first_name,    MAX(CASE WHEN t.field_id = 15 THEN t.value ELSE NULL END) AS last_nameFROM    name_of_table tWHERE    t.field_id IN (9, 15) -- 仅筛选出我们关心的field_id,减少处理的数据量GROUP BY    t.app_id;

PHP实现示例:

$mysqli = new mysqli("localhost", "dbuser", "dbpass", "dbname");$mysqli->set_charset("utf8mb4");$sql = "    SELECT        t.app_id,        MAX(CASE WHEN t.field_id = 9 THEN t.value ELSE NULL END) AS first_name,        MAX(CASE WHEN t.field_id = 15 THEN t.value ELSE NULL END) AS last_name    FROM        name_of_table t    WHERE        t.field_id IN (9, 15)    GROUP BY        t.app_id";$result = $mysqli->query($sql);if ($result) {    while ($row = $result->fetch_assoc()) {        echo "用户ID: " . $row['app_id'] . ", 姓: " . ($row['first_name'] ?? 'N/A') . ", 名: " . ($row['last_name'] ?? 'N/A') . "
"; } $result->free(); // 释放结果集} else { echo "查询失败: " . $mysqli->error;}$mysqli->close();

优点:

单次数据库查询: 极大地减少了数据库的I/O和连接开销。数据库优化: 数据库管理系统(DBMS)通常在处理聚合和分组方面非常高效。结果集小: 直接返回结构化的结果,PHP接收到的数据量更小,处理更直接。可扩展性: 如果需要获取更多字段,只需在SELECT子句中添加更多的MAX(CASE WHEN …)表达式。

注意事项:

确保field_id列上有索引,这将显著提高WHERE子句和GROUP BY操作的性能。MAX()函数在这里不是为了找到最大值,而是因为GROUP BY操作需要一个聚合函数。CASE WHEN确保了只有匹配的field_id的值被选中,其他为NULL,MAX()会忽略NULL并返回唯一非NULL的值。

2. 方案二:单次查询与PHP内存处理(适用于复杂场景)

如果SQL聚合逻辑变得过于复杂,或者需要在PHP中进行更灵活的后续处理,那么一次性查询所有相关数据并在PHP内存中高效处理也是一个不错的选择。关键在于,只查询我们需要的app_id、field_id和value,而不是SELECT *。

$mysqli = new mysqli("localhost", "dbuser", "dbpass", "dbname");$mysqli->set_charset("utf8mb4");// 仅查询我们关心的字段和field_id$stmt = $mysqli->prepare("SELECT app_id, field_id, value FROM name_of_table WHERE field_id IN (?, ?)");$field_id_first_name = 9;$field_id_last_name = 15;$stmt->bind_param("ii", $field_id_first_name, $field_id_last_name);$stmt->execute();$result = $stmt->get_result(); // 获取结果集$users_data = [];while ($row = $result->fetch_assoc()) {    $app_id = $row['app_id'];    $field_id = $row['field_id'];    $value = $row['value'];    // 初始化用户数据结构    if (!isset($users_data[$app_id])) {        $users_data[$app_id] = [            'first_name' => null,            'last_name' => null,        ];    }    // 根据field_id分配值    if ($field_id == $field_id_first_name) {        $users_data[$app_id]['first_name'] = $value;    } elseif ($field_id == $field_id_last_name) {        $users_data[$app_id]['last_name'] = $value;    }}// 此时 $users_data 包含了所有用户的姓和名,可以进行后续处理foreach ($users_data as $app_id => $data) {    echo "用户ID: " . $app_id . ", 姓: " . ($data['first_name'] ?? 'N/A') . ", 名: " . ($data['last_name'] ?? 'N/A') . "
";}$stmt->close();$mysqli->close();

优点:

单次数据库查询: 同样减少了数据库交互。PHP处理灵活性: 可以在PHP中进行更复杂的逻辑处理,例如字段验证、格式化或与其他数据源的合并。内存效率: 使用while ($row = $result->fetch_assoc())逐行获取数据,可以减少一次性将所有数据加载到内存的压力(相比fetch_all())。

注意事项:

同样需要确保field_id和app_id列上有索引。如果结果集非常庞大,即使逐行处理,PHP脚本的内存使用量和执行时间也可能成为问题。在这种情况下,SQL条件聚合通常是更好的选择。

总结

在处理MySQL非规范化EAV表中的数据时,尤其是在面对大型数据集时,性能优化至关重要。

避免在循环中执行多次数据库查询。 这是最常见的性能杀手。首选SQL条件聚合 (MAX(CASE WHEN … GROUP BY)),它将数据重组的复杂性推给数据库,通常能获得最佳性能。当SQL聚合不适用或PHP需要更灵活处理时,使用单次查询结合PHP内存处理。 确保只查询必要的字段,并逐行处理结果集以优化内存使用。

通过选择合适的策略并结合数据库索引优化,您可以显著提升从非规范化表中提取和组织数据的效率,确保应用程序的响应速度和稳定性。

以上就是MySQL非规范化表数据高效提取与PHP处理教程的详细内容,更多请关注php中文网其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1326989.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月12日 13:22:29
下一篇 2025年12月12日 13:22:42

相关推荐

  • Bear 博客上的浅色/深色模式分步指南

    我最近使用偏好颜色方案媒体功能与 light-dark() 颜色函数相结合,在我的 bear 博客上实现了亮/暗模式切换。 我是这样做的。 第 1 步:设置 css css 在过去几年中获得了一些很酷的新功能,包括 light-dark() 颜色函数。此功能可让您为任何元素指定两种颜色 &#8211…

    2025年12月24日
    100
  • 在 JavaScript 中移动 TodoList 中的“正在进行”任务如何解决?

    javascript 中使用 dom 更新 todolist 在您的问题中,您遇到了在使用 javascript 通过 dom 更新 todolist 时遇到困难的问题。具体来说,您无法将“正在进行”的任务移动到“已完成”部分。 问题原因 在您提供的 javascript 代码中,拼写错误导致“正在…

    2025年12月24日
    000
  • 在使用 JavaScript 实现的 TodoList 中,如何正确判断 Checkbox 点击事件,从而归类任务?

    使用 javascript 实现 todolist,点击 checkbox 后无法正确归类任务 问题描述:在使用 javascript 实现的 todolist 中,点击“正在进行”任务中的 checkbox,无法将任务自动归类到“已完成”任务列表。 原因分析:在提供的代码中,发现有一个单词拼写错误…

    2025年12月24日
    400
  • 网络进化!

    Web 应用程序从静态网站到动态网页的演变是由对更具交互性、用户友好性和功能丰富的 Web 体验的需求推动的。以下是这种范式转变的概述: 1. 静态网站(1990 年代) 定义:静态网站由用 HTML 编写的固定内容组成。每个页面都是预先构建并存储在服务器上,并且向每个用户传递相同的内容。技术:HT…

    2025年12月24日
    000
  • 为什么多年的经验让我选择全栈而不是平均栈

    在全栈和平均栈开发方面工作了 6 年多,我可以告诉您,虽然这两种方法都是流行且有效的方法,但它们满足不同的需求,并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序,但它们的实现方式却截然不同。如果您在两者之间难以选择,我希望我在两者之间的经验能给您一些有用的见解。 在这篇文章中,我…

    2025年12月24日
    000
  • 应对性能瓶颈:前端工程师的重绘与回流解决方案

    重绘和回流解密:前端工程师如何应对性能瓶颈 引言:随着互联网的快速发展,前端工程师的角色越来越重要。他们需要处理用户界面的设计和开发,同时还要关注网站性能的优化。在前端性能优化中,重绘和回流是常见的性能瓶颈。本文将详细介绍重绘和回流的原理,并提供一些实用的代码示例,帮助前端工程师应对性能瓶颈。 一、…

    2025年12月24日
    200
  • 网页设计css样式代码大全,快来收藏吧!

    减少很多不必要的代码,html+css可以很方便的进行网页的排版布局。小伙伴们收藏好哦~ 一.文本设置    1、font-size: 字号参数  2、font-style: 字体格式 3、font-weight: 字体粗细 4、颜色属性 立即学习“前端免费学习笔记(深入)”; color: 参数 …

    2025年12月24日
    000
  • css中id选择器和class选择器有何不同

    之前的文章《什么是CSS语法?详细介绍使用方法及规则》中带了解CSS语法使用方法及规则。下面本篇文章来带大家了解一下CSS中的id选择器与class选择器,介绍一下它们的区别,快来一起学习吧!! id选择器和class选择器介绍 CSS中对html元素的样式进行控制是通过CSS选择器来完成的,最常用…

    2025年12月24日
    000
  • phpcms有订单功能吗?

    phpcms有订单功能吗? phpcms有订单功能,phpcms是一款网站管理软件,同时也是一个开源的PHP开发框架,该软件内置了内容模型、会员、问吧、专题、财务、订单、广告、邮件订阅、 短消息、自定义表单等20多个功能模块。 phpcms 特色 HPCMS V9(简称V9)采用PHP5+MYSQL…

    2025年12月24日
    000
  • CSS如何实现任意角度的扇形(代码示例)

    本篇文章给大家带来的内容是关于CSS如何实现任意角度的扇形(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 扇形制作原理,底部一个纯色原形,里面2个相同颜色的半圆,可以是白色,内部半圆按一定角度变化,就可以产生出扇形效果 扇形绘制 .shanxing{ position:…

    2025年12月24日
    000
  • 利用CSS3编写类似iOS中的复选框及带开关的按钮的代码

    这篇文章主要介绍了使用css3编写类似ios中的复选框及带开关的按钮,需要的朋友可以参考下 checkbox多选 最近写了一个适合移动端的checkbox,如图: ps:中间的勾勾是iconfont,iOS风格的。 具体的HTML: 立即学习“前端免费学习笔记(深入)”; 默认未选中 默认选中 橘黄…

    2025年12月24日
    000
  • php约瑟夫问题如何解决

    “约瑟夫环”是一个数学的应用问题:一群猴子排成一圈,按1,2,…,n依次编号。然后从第1只开始数,数到第m只,把它踢出圈,从它后面再开始数, 再数到第m只,在把它踢出去…,如此不停的进行下去, 直到最后只剩下一只猴子为止,那只猴子就叫做大王。要求编程模拟此过程,输入m、n, 输出最后那个大王的编号。…

    好文分享 2025年12月24日
    000
  • CSS新手整理的有关CSS使用技巧

    [导读]  1、不要使用过小的图片做背景平铺。这就是为何很多人都不用 1px 的原因,这才知晓。宽高 1px 的图片平铺出一个宽高 200px 的区域,需要 200*200=40, 000 次,占用资源。  2、无边框。推荐的写法是     1、不要使用过小的图片做背景平铺。这就是为何很多人都不用 …

    好文分享 2025年12月23日
    000
  • CSS中实现图片垂直居中方法详解

    [导读] 在曾经的 淘宝ued 招聘 中有这样一道题目:“使用纯css实现未知尺寸的图片(但高宽都小于200px)在200px的正方形容器中水平和垂直居中。”当然出题并不是随意,而是有其现实的原因,垂直居中是 淘宝 工作中最 在曾经的 淘宝UED 招聘 中有这样一道题目: “使用纯CSS实现未知尺寸…

    好文分享 2025年12月23日
    000
  • CSS派生选择器

    [导读] 派生选择器通过依据元素在其位置的上下文关系来定义样式,你可以使标记更加简洁。在 css1 中,通过这种方式来应用规则的选择器被称为上下文选择器 (contextual selectors),这是由于它们依赖于上下文关系来应 派生选择器 通过依据元素在其位置的上下文关系来定义样式,你可以使标…

    好文分享 2025年12月23日
    000
  • CSS 基础语法

    [导读] css 语法 css 规则由两个主要的部分构成:选择器,以及一条或多条声明。selector {declaration1; declaration2;     declarationn }选择器通常是您需要改变样式的 html 元素。每条声明由一个属性和一个 CSS 语法 CSS 规则由两…

    2025年12月23日
    300
  • CSS 高级语法

    [导读] 选择器的分组你可以对选择器进行分组,这样,被分组的选择器就可以分享相同的声明。用逗号将需要分组的选择器分开。在下面的例子中,我们对所有的标题元素进行了分组。所有的标题元素都是绿色的。h1,h2,h3,h4,h5 选择器的分组 你可以对选择器进行分组,这样,被分组的选择器就可以分享相同的声明…

    好文分享 2025年12月23日
    000
  • CSS id 选择器

    [导读] id 选择器id 选择器可以为标有特定 id 的 html 元素指定特定的样式。id 选择器以 ” ” 来定义。下面的两个 id 选择器,第一个可以定义元素的颜色为红色,第二个定义元素的颜色为绿色: red {color:re id 选择器 id 选择器可以为标有特…

    好文分享 2025年12月23日
    000
  • 有关css的绝对定位

    [导读] 定位(左边和顶部) css定位属性将是网虫们打开幸福之门的钥匙: h4 { position: absolute; left: 100px; top: 43px }这项css规则让浏览器将 的起始位置精 确地定在距离浏览器左边100象素,距离其 定位(左边和顶部) css定位属性将是网虫们…

    好文分享 2025年12月23日
    000
  • jimdo如何添加html5表单_jimdo表单html5代码嵌入与字段设置【实操】

    可通过嵌入HTML5表单代码、启用字段验证属性、添加CSS样式反馈及替换提交按钮并绑定JS事件四种方式在Jimdo实现自定义表单行为。 如果您在 Jimdo 网站中需要自定义表单行为或字段逻辑,而内置表单编辑器无法满足需求,则可通过嵌入 HTML5 表单代码实现更灵活的控制。以下是具体操作步骤: 一…

    2025年12月23日
    000

发表回复

登录后才能评论
关注微信