MySQL非规范化表数据高效提取与PHP处理教程

程序猿 • 2025年12月12日 13:22:32 • 用户投稿 • 阅读 0

本教程旨在解决从mysql非规范化eav（实体-属性-值）表中高效提取和组织特定用户数据（如姓名）的问题。针对大型数据集（数万行），传统的多查询循环方式效率低下。文章将深入探讨两种优化策略：一是利用sql的条件聚合功能在数据库层面直接重构数据，实现单次查询的高效数据转换；二是采用单次全量查询结合php内存处理，灵活重组数据。教程将提供详细代码示例、性能考量及注意事项，帮助开发者在处理类似场景时实现卓越性能。

从非规范化表中高效提取与组织用户数据

在Web开发中，尤其是在使用某些内容管理系统（CMS）或第三方插件时，我们经常会遇到数据存储在非规范化的EAV（Entity-Attribute-Value，实体-属性-值）模式表中。这种模式的特点是，不同的属性值（例如用户的姓、名、地址、邮箱）都存储在同一个value列中，并通过一个field_id来标识其具体含义，而用户或实体则通过app_id等字段来唯一识别。

例如，一个典型的EAV表结构可能如下所示：

ID app_id field_id value

xxxyyy9First Namexxxyyy15Last Namezzzaaa9Anotherzzzaaa15User

其中，app_id代表用户ID，field_id为9表示“First Name”，field_id为15表示“Last Name”。我们的目标是高效地从这张表中为每个用户提取出其姓和名，并将其组合或以结构化形式呈现。

挑战：大型数据集的性能瓶颈

当表中的数据量达到数万甚至数十万行时，传统的“为每个用户ID循环查询”或“全表查询后在PHP中进行低效嵌套循环处理”的方法将导致严重的性能问题，例如查询时间过长（10分钟以上）和服务器负载过高。因此，我们需要寻找更高效的数据提取和组织策略。

立即学习“PHP免费学习笔记（深入）”；

常见的低效方法及其问题

1. PHP中多层循环处理全量数据

初学者可能会尝试一次性查询出所有数据，然后在PHP中通过多层循环来匹配和重组数据。

$mysqli = new mysqli("localhost", "dbuser", "dbpass", "dbname");$mysqli->set_charset("utf8mb4");$fields = $mysqli->query("SELECT app_id, field_id, value FROM name_of_table");$results = $fields->fetch_all(MYSQLI_ASSOC); // 获取所有数据$users_data = [];foreach ($results as $row) {    $app_id = $row['app_id'];    $field_id = $row['field_id'];    $value = $row['value'];    if (!isset($users_data[$app_id])) {        $users_data[$app_id] = [            'first_name' => null,            'last_name' => null,        ];    }    // 根据field_id分配值    if ($field_id == 9) { // 假设9是First Name        $users_data[$app_id]['first_name'] = $value;    } elseif ($field_id == 15) { // 假设15是Last Name        $users_data[$app_id]['last_name'] = $value;    }}// 此时 $users_data 包含了所有用户的姓和名foreach ($users_data as $app_id => $data) {    echo "用户ID: " . $app_id . ", 姓: " . ($data['first_name'] ?? 'N/A') . ", 名: " . ($data['last_name'] ?? 'N/A') . "
";}$mysqli->close();

问题分析： 尽管避免了多次数据库查询，但如果数据量非常大，fetch_all()可能会占用大量内存。在PHP中处理大量数据（例如20,000行或更多）也会消耗显著的CPU资源。

2. 在循环中执行多次数据库查询

另一种常见的错误是遍历用户ID列表，并在每次迭代中执行一个数据库查询。

// 假设 $count 是最大的 app_id 或需要处理的 app_id 范围for ($i = $count; $i >= ($count - 1000); $i--) { // 循环1000次    // 每次循环都执行一次数据库查询    $data = $mysqli->query("SELECT field_id, value FROM name_of_table WHERE app_id = $i AND field_id IN (9, 15)");    $names = $data->fetch_all(MYSQLI_NUM);    $first_name = null;    $last_name = null;    foreach ($names as list($field_id, $value)) {        switch ($field_id) {            case 9:                $first_name = $value;                break;            case 15:                $last_name = $value;                break;        }    }    // 输出或存储 $first_name, $last_name    if ($first_name || $last_name) {        echo "用户ID: " . $i . ", 姓: " . ($first_name ?? 'N/A') . ", 名: " . ($last_name ?? 'N/A') . "
";    }}$mysqli->close();

问题分析： 这种方法对数据库的压力极大。每次循环都会建立新的查询连接、解析SQL、执行查询、传输结果，这些开销累积起来会非常显著。对于20,000行数据，如果需要处理数千个不同的app_id，将导致数千次数据库查询，性能将急剧下降。

高效解决方案

为了克服上述性能瓶颈，我们应该尽量减少数据库交互次数，并尽可能将数据重组的逻辑推到数据库层面或在PHP中进行高效的内存处理。

1. 方案一：SQL条件聚合（推荐）

这是最推荐的方法，它利用SQL的条件聚合功能，在数据库层面通过单次查询完成数据的“透视”或重组。

SELECT    t.app_id,    MAX(CASE WHEN t.field_id = 9 THEN t.value ELSE NULL END) AS first_name,    MAX(CASE WHEN t.field_id = 15 THEN t.value ELSE NULL END) AS last_nameFROM    name_of_table tWHERE    t.field_id IN (9, 15) -- 仅筛选出我们关心的field_id，减少处理的数据量GROUP BY    t.app_id;

PHP实现示例：

$mysqli = new mysqli("localhost", "dbuser", "dbpass", "dbname");$mysqli->set_charset("utf8mb4");$sql = "    SELECT        t.app_id,        MAX(CASE WHEN t.field_id = 9 THEN t.value ELSE NULL END) AS first_name,        MAX(CASE WHEN t.field_id = 15 THEN t.value ELSE NULL END) AS last_name    FROM        name_of_table t    WHERE        t.field_id IN (9, 15)    GROUP BY        t.app_id";$result = $mysqli->query($sql);if ($result) {    while ($row = $result->fetch_assoc()) {        echo "用户ID: " . $row['app_id'] . ", 姓: " . ($row['first_name'] ?? 'N/A') . ", 名: " . ($row['last_name'] ?? 'N/A') . "
";    }    $result->free(); // 释放结果集} else {    echo "查询失败: " . $mysqli->error;}$mysqli->close();

优点：

单次数据库查询： 极大地减少了数据库的I/O和连接开销。数据库优化： 数据库管理系统（DBMS）通常在处理聚合和分组方面非常高效。结果集小： 直接返回结构化的结果，PHP接收到的数据量更小，处理更直接。可扩展性： 如果需要获取更多字段，只需在SELECT子句中添加更多的MAX(CASE WHEN …)表达式。

注意事项：

确保field_id列上有索引，这将显著提高WHERE子句和GROUP BY操作的性能。MAX()函数在这里不是为了找到最大值，而是因为GROUP BY操作需要一个聚合函数。CASE WHEN确保了只有匹配的field_id的值被选中，其他为NULL，MAX()会忽略NULL并返回唯一非NULL的值。

2. 方案二：单次查询与PHP内存处理（适用于复杂场景）

如果SQL聚合逻辑变得过于复杂，或者需要在PHP中进行更灵活的后续处理，那么一次性查询所有相关数据并在PHP内存中高效处理也是一个不错的选择。关键在于，只查询我们需要的app_id、field_id和value，而不是SELECT *。

$mysqli = new mysqli("localhost", "dbuser", "dbpass", "dbname");$mysqli->set_charset("utf8mb4");// 仅查询我们关心的字段和field_id$stmt = $mysqli->prepare("SELECT app_id, field_id, value FROM name_of_table WHERE field_id IN (?, ?)");$field_id_first_name = 9;$field_id_last_name = 15;$stmt->bind_param("ii", $field_id_first_name, $field_id_last_name);$stmt->execute();$result = $stmt->get_result(); // 获取结果集$users_data = [];while ($row = $result->fetch_assoc()) {    $app_id = $row['app_id'];    $field_id = $row['field_id'];    $value = $row['value'];    // 初始化用户数据结构    if (!isset($users_data[$app_id])) {        $users_data[$app_id] = [            'first_name' => null,            'last_name' => null,        ];    }    // 根据field_id分配值    if ($field_id == $field_id_first_name) {        $users_data[$app_id]['first_name'] = $value;    } elseif ($field_id == $field_id_last_name) {        $users_data[$app_id]['last_name'] = $value;    }}// 此时 $users_data 包含了所有用户的姓和名，可以进行后续处理foreach ($users_data as $app_id => $data) {    echo "用户ID: " . $app_id . ", 姓: " . ($data['first_name'] ?? 'N/A') . ", 名: " . ($data['last_name'] ?? 'N/A') . "
";}$stmt->close();$mysqli->close();

优点：

单次数据库查询： 同样减少了数据库交互。PHP处理灵活性： 可以在PHP中进行更复杂的逻辑处理，例如字段验证、格式化或与其他数据源的合并。内存效率： 使用while ($row = $result->fetch_assoc())逐行获取数据，可以减少一次性将所有数据加载到内存的压力（相比fetch_all()）。

注意事项：

同样需要确保field_id和app_id列上有索引。如果结果集非常庞大，即使逐行处理，PHP脚本的内存使用量和执行时间也可能成为问题。在这种情况下，SQL条件聚合通常是更好的选择。

总结

在处理MySQL非规范化EAV表中的数据时，尤其是在面对大型数据集时，性能优化至关重要。

避免在循环中执行多次数据库查询。 这是最常见的性能杀手。首选SQL条件聚合 (MAX(CASE WHEN … GROUP BY))，它将数据重组的复杂性推给数据库，通常能获得最佳性能。当SQL聚合不适用或PHP需要更灵活处理时，使用单次查询结合PHP内存处理。 确保只查询必要的字段，并逐行处理结果集以优化内存使用。

通过选择合适的策略并结合数据库索引优化，您可以显著提升从非规范化表中提取和组织数据的效率，确保应用程序的响应速度和稳定性。

以上就是MySQL非规范化表数据高效提取与PHP处理教程的详细内容，更多请关注php中文网其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1326989.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

PHP函数数组参数处理_PHP数组参数接收与类型检查方法

上一篇 2025年12月12日 13:22:29

Yii框架：在activeTextArea中向模型属性值追加字符串的正确方法

下一篇 2025年12月12日 13:22:42

好文分享

Bear 博客上的浅色/深色模式分步指南

我最近使用偏好颜色方案媒体功能与 light-dark() 颜色函数相结合，在我的 bear 博客上实现了亮/暗模式切换。我是这样做的。第 1 步：设置 css css 在过去几年中获得了一些很酷的新功能，包括 light-dark() 颜色函数。此功能可让您为任何元素指定两种颜色 &#8211…

程序猿
2025年12月24日
2000
好文分享

在 JavaScript 中移动 TodoList 中的“正在进行”任务如何解决？

javascript 中使用 dom 更新 todolist 在您的问题中，您遇到了在使用 javascript 通过 dom 更新 todolist 时遇到困难的问题。具体来说，您无法将“正在进行”的任务移动到“已完成”部分。问题原因在您提供的 javascript 代码中，拼写错误导致“正在…

程序猿
2025年12月24日
0000
好文分享

在使用 JavaScript 实现的 TodoList 中，如何正确判断 Checkbox 点击事件，从而归类任务？

使用 javascript 实现 todolist，点击 checkbox 后无法正确归类任务问题描述：在使用 javascript 实现的 todolist 中，点击“正在进行”任务中的 checkbox，无法将任务自动归类到“已完成”任务列表。原因分析：在提供的代码中，发现有一个单词拼写错误…

程序猿
2025年12月24日
4000
好文分享

网络进化！

Web 应用程序从静态网站到动态网页的演变是由对更具交互性、用户友好性和功能丰富的 Web 体验的需求推动的。以下是这种范式转变的概述： 1. 静态网站（1990 年代）定义：静态网站由用 HTML 编写的固定内容组成。每个页面都是预先构建并存储在服务器上，并且向每个用户传递相同的内容。技术：HT…

程序猿
2025年12月24日
0000
好文分享

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
3000
好文分享

应对性能瓶颈：前端工程师的重绘与回流解决方案

重绘和回流解密：前端工程师如何应对性能瓶颈引言：随着互联网的快速发展，前端工程师的角色越来越重要。他们需要处理用户界面的设计和开发，同时还要关注网站性能的优化。在前端性能优化中，重绘和回流是常见的性能瓶颈。本文将详细介绍重绘和回流的原理，并提供一些实用的代码示例，帮助前端工程师应对性能瓶颈。一、…

程序猿
2025年12月24日
2000
好文分享

网页设计css样式代码大全，快来收藏吧！

减少很多不必要的代码，html+css可以很方便的进行网页的排版布局。小伙伴们收藏好哦~ 一.文本设置 1、font-size: 字号参数 2、font-style: 字体格式 3、font-weight: 字体粗细 4、颜色属性立即学习“前端免费学习笔记（深入）”； color: 参数 …

程序猿
2025年12月24日
1000
好文分享

css中id选择器和class选择器有何不同

之前的文章《什么是CSS语法？详细介绍使用方法及规则》中带了解CSS语法使用方法及规则。下面本篇文章来带大家了解一下CSS中的id选择器与class选择器，介绍一下它们的区别，快来一起学习吧！！ id选择器和class选择器介绍 CSS中对html元素的样式进行控制是通过CSS选择器来完成的，最常用…

程序猿
2025年12月24日
2000
好文分享

phpcms有订单功能吗？

phpcms有订单功能吗？ phpcms有订单功能，phpcms是一款网站管理软件，同时也是一个开源的PHP开发框架，该软件内置了内容模型、会员、问吧、专题、财务、订单、广告、邮件订阅、短消息、自定义表单等20多个功能模块。 phpcms 特色 HPCMS V9（简称V9）采用PHP5+MYSQL…

程序猿
2025年12月24日
0000
好文分享

CSS如何实现任意角度的扇形（代码示例）

本篇文章给大家带来的内容是关于CSS如何实现任意角度的扇形（代码示例），有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。扇形制作原理，底部一个纯色原形，里面2个相同颜色的半圆，可以是白色,内部半圆按一定角度变化，就可以产生出扇形效果扇形绘制 .shanxing{ position:…

程序猿
2025年12月24日
1000
好文分享

利用CSS3编写类似iOS中的复选框及带开关的按钮的代码

这篇文章主要介绍了使用css3编写类似ios中的复选框及带开关的按钮,需要的朋友可以参考下 checkbox多选最近写了一个适合移动端的checkbox，如图： ps：中间的勾勾是iconfont，iOS风格的。具体的HTML：立即学习“前端免费学习笔记（深入）”；默认未选中默认选中橘黄…

程序猿
2025年12月24日
0000
php约瑟夫问题如何解决

“约瑟夫环”是一个数学的应用问题：一群猴子排成一圈，按1,2,…,n依次编号。然后从第1只开始数，数到第m只,把它踢出圈，从它后面再开始数，再数到第m只，在把它踢出去…，如此不停的进行下去，直到最后只剩下一只猴子为止，那只猴子就叫做大王。要求编程模拟此过程，输入m、n, 输出最后那个大王的编号。…

程序猿
好文分享 2025年12月24日
1000
CSS新手整理的有关CSS使用技巧

[导读] 1、不要使用过小的图片做背景平铺。这就是为何很多人都不用 1px 的原因，这才知晓。宽高 1px 的图片平铺出一个宽高 200px 的区域，需要 200*200=40, 000 次，占用资源。 2、无边框。推荐的写法是 1、不要使用过小的图片做背景平铺。这就是为何很多人都不用 …

程序猿
好文分享 2025年12月23日
1000
CSS中实现图片垂直居中方法详解

[导读] 在曾经的淘宝ued 招聘中有这样一道题目：“使用纯css实现未知尺寸的图片(但高宽都小于200px)在200px的正方形容器中水平和垂直居中。”当然出题并不是随意，而是有其现实的原因，垂直居中是淘宝工作中最在曾经的淘宝UED 招聘中有这样一道题目： “使用纯CSS实现未知尺寸…

程序猿
好文分享 2025年12月23日
1000
CSS派生选择器

[导读] 派生选择器通过依据元素在其位置的上下文关系来定义样式，你可以使标记更加简洁。在 css1 中，通过这种方式来应用规则的选择器被称为上下文选择器 (contextual selectors)，这是由于它们依赖于上下文关系来应派生选择器通过依据元素在其位置的上下文关系来定义样式，你可以使标…

程序猿
好文分享 2025年12月23日
3000
好文分享

CSS 基础语法

[导读] css 语法 css 规则由两个主要的部分构成：选择器，以及一条或多条声明。selector {declaration1; declaration2; declarationn }选择器通常是您需要改变样式的 html 元素。每条声明由一个属性和一个 CSS 语法 CSS 规则由两…

程序猿
2025年12月23日
4000
CSS 高级语法

[导读] 选择器的分组你可以对选择器进行分组，这样，被分组的选择器就可以分享相同的声明。用逗号将需要分组的选择器分开。在下面的例子中，我们对所有的标题元素进行了分组。所有的标题元素都是绿色的。h1,h2,h3,h4,h5 选择器的分组你可以对选择器进行分组，这样，被分组的选择器就可以分享相同的声明…

程序猿
好文分享 2025年12月23日
1000
CSS id 选择器

[导读] id 选择器id 选择器可以为标有特定 id 的 html 元素指定特定的样式。id 选择器以 ” ” 来定义。下面的两个 id 选择器，第一个可以定义元素的颜色为红色，第二个定义元素的颜色为绿色： red {color:re id 选择器 id 选择器可以为标有特…

程序猿
好文分享 2025年12月23日
1000
有关css的绝对定位

[导读] 定位（左边和顶部） css定位属性将是网虫们打开幸福之门的钥匙： h4 { position: absolute; left: 100px; top: 43px }这项css规则让浏览器将的起始位置精确地定在距离浏览器左边100象素，距离其定位（左边和顶部） css定位属性将是网虫们…

程序猿
好文分享 2025年12月23日
1000
好文分享

jimdo如何添加html5表单_jimdo表单html5代码嵌入与字段设置【实操】

可通过嵌入HTML5表单代码、启用字段验证属性、添加CSS样式反馈及替换提交按钮并绑定JS事件四种方式在Jimdo实现自定义表单行为。如果您在 Jimdo 网站中需要自定义表单行为或字段逻辑，而内置表单编辑器无法满足需求，则可通过嵌入 HTML5 表单代码实现更灵活的控制。以下是具体操作步骤：一…

程序猿
2025年12月23日
1000