处理PHP中JSON文件集合并按键聚合数据的教程

处理php中json文件集合并按键聚合数据的教程

本教程旨在指导如何在PHP中高效处理一组JSON文件,解析其内容,并根据特定键(如`weeknr`)聚合数值型数据。文章将详细介绍如何使用`glob`函数获取文件列表,`json_decode`将JSON字符串转换为PHP关联数组,并演示一种优雅的数据聚合策略,最终生成按周汇总的日工时和电视时间数据,为后续的表格输出奠定基础。

1. 引言与需求分析

在数据处理场景中,我们经常需要从多个结构相似的文件中提取信息并进行汇总。本教程将以处理一系列JSON文件为例,每个文件包含一周的工作日信息,如周数(weeknr)、每日工时(dayhours)和电视时间(tvt)。我们的目标是读取所有这些文件,然后按周数聚合每日工时和电视时间,最终得到每周末的总工时和总电视时间。

以下是示例JSON文件的结构:

{    "id": "id_1638974137049",    "weeknr": 48,    "dayhours": 5,    "tvt": 1.25}

2. 读取与解析JSON文件

首先,我们需要定位并读取所有目标JSON文件,然后将它们的JSON内容解析成PHP可操作的数据结构。

立即学习“PHP免费学习笔记(深入)”;

2.1 获取文件列表

PHP的glob()函数是一个非常实用的工具,可以根据模式匹配查找文件路径。假设所有JSON文件都存放在名为data的子目录中,我们可以这样获取文件列表:

$files = glob('data/*.json'); // 获取 'data/' 目录下所有 .json 文件的路径

$files变量现在是一个包含所有JSON文件路径的数组。

2.2 解析JSON内容

遍历文件列表,对每个文件执行以下操作:

使用file_get_contents()读取文件内容,这会返回一个JSON字符串。使用json_decode()将JSON字符串解码为PHP数据。传入true作为第二个参数,可以将JSON对象解码为关联数组,这通常比标准对象更便于操作。

$objs = []; // 用于存储所有解析后的JSON数据foreach($files as $file) {    $json_content = file_get_contents($file);    if ($json_content === false) {        // 错误处理:文件读取失败        error_log("Failed to read file: " . $file);        continue;    }    $decoded_data = json_decode($json_content, true);    if (json_last_error() !== JSON_ERROR_NONE) {        // 错误处理:JSON解码失败        error_log("JSON decode error for file " . $file . ": " . json_last_error_msg());        continue;    }    $objs[] = $decoded_data; // 将解码后的关联数组添加到 $objs 数组中}

经过这一步,$objs数组将包含所有JSON文件的内容,每个元素都是一个关联数组,代表一个JSON对象。

3. 数据聚合逻辑

现在我们拥有了所有原始数据,下一步是根据weeknr聚合dayhours和tvt。我们将创建一个新的数组,以weeknr作为主键,存储每个周的总工时和总电视时间。

3.1 初始化聚合数组

在开始聚合之前,最好先初始化一个空数组来存储最终的聚合结果:

$weeksData = []; // 用于存储按周聚合的数据

3.2 遍历并累加数据

遍历$objs数组,对于每个数据项:

提取当前的weeknr。使用weeknr作为键来访问或初始化$weeksData中的对应项。累加dayhours和tvt。

这里需要注意的是,当第一次遇到某个weeknr时,$weeksData[$val[‘weeknr’]][‘dayhours’]可能尚未定义。为了避免PHP警告并确保正确累加,我们可以使用null合并运算符 ??

foreach($objs as $val) {    $weeknr = $val['weeknr'];    // 使用 weeknr 作为数组键,并累加 dayhours 和 tvt    // 如果 $weeksData[$weeknr] 或其子键尚未定义,则将其视为 0    $weeksData[$weeknr] = [        'dayhours' => ($weeksData[$weeknr]['dayhours'] ?? 0) + $val['dayhours'],        'tvt'      => ($weeksData[$weeknr]['tvt'] ?? 0) + $val['tvt']    ];}

完整代码示例:

 ($weeksData[$weeknr]['dayhours'] ?? 0) + $val['dayhours'],        'tvt'      => ($weeksData[$weeknr]['tvt'] ?? 0) + $val['tvt']    ];}// 4. (可选) 排序并输出结果// 如果需要按 weeknr 排序,可以使用 ksort()ksort($weeksData);echo "
";print_r($weeksData);echo "

";/*预期 $weeksData 结构类似:Array( [48] => Array ( [dayhours] => 18 [tvt] => 4.5 ) [49] => Array ( [dayhours] => 20 [tvt] => 6.5 ) // ... 其他周的数据)*/// 5. 生成 HTML 表格输出 (根据原始需求)echo "";echo "

weeknr tot dayhours tot tvt hours

";echo "";foreach ($weeksData as $weeknr => $data) { echo ""; echo "" . htmlspecialchars($weeknr) . ""; echo "" . htmlspecialchars($data['dayhours']) . ""; echo "" . htmlspecialchars(sprintf("%.2f", $data['tvt'])) . ""; // 格式化 tvt 为两位小数 echo "";}echo "";echo "";?>

4. 注意事项与优化

错误处理: 在实际应用中,务必对file_get_contents()和json_decode()的返回值进行检查,处理文件不存在、读取失败或JSON格式错误等情况。性能考虑: 对于非常大量的JSON文件或每个文件包含大量数据的情况,考虑分批处理或使用更高效的I/O操作。数据类型: 确保JSON中的数值类型在PHP中被正确处理。json_decode通常能正确转换,但如果需要特定精度,可能需要额外的格式化(如sprintf)。输出格式: 聚合后的$weeksData数组可以直接用于生成HTML表格、CSV文件或进一步的数据分析。在生成HTML时,使用htmlspecialchars()可以有效防止XSS攻击。

5. 总结

本教程详细阐述了在PHP中处理多个JSON文件并按特定键聚合数据的完整流程。通过glob()函数获取文件列表,file_get_contents()和json_decode()解析文件内容,以及巧妙利用关联数组和null合并运算符进行数据聚合,我们能够高效地将分散的数据汇总成结构化的信息,为后续的数据展示和分析奠定坚实基础。掌握这些技巧对于PHP开发者处理文件系统中的结构化数据至关重要。

以上就是处理PHP中JSON文件集合并按键聚合数据的教程的详细内容,更多请关注php中文网其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1335239.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月12日 21:02:24
下一篇 2025年12月12日 21:02:31

相关推荐

  • 使用 CodeIgniter 3 通过外键从表中获取数据

    本文档旨在指导开发者如何在 CodeIgniter 3 框架中,通过外键关联的表之间高效地获取所需数据。重点讲解使用 JOIN 查询替代循环查询,提升数据检索性能,并强调MVC架构中模型(Model)层负责数据操作的最佳实践,避免在控制器(Controller)中直接操作数据库。 在 CodeIgn…

    2025年12月12日
    000
  • 修复多步骤表单中点击按钮后选项卡自动返回的问题

    本文针对多步骤表单开发中,点击按钮切换选项卡时页面自动返回第一个选项卡的问题,进行了深入分析并提供了有效的解决方案。通过移除不必要的 “ 标签,避免了页面刷新,从而保证了选项卡切换的正确性。本文还提供了代码示例,帮助开发者快速定位和解决类似问题,提升用户体验。 在开发多步骤表单时,经常会…

    2025年12月12日
    000
  • Google Domains 域名列表程序化获取:API 现状与限制

    目前,google domains 尚未提供官方api,允许用户程序化地获取其账户下注册的域名列表。尽管存在google cloud domains api和rdap api,但它们服务于不同的目的,无法直接用于查询google domains注册商账户的域名资产。因此,开发者目前无法通过编程方式实…

    2025年12月12日
    000
  • 解决 Laravel 与 Mollie Webhook 集成失效问题

    本文旨在解决 Laravel 应用中 Mollie Webhook 不工作的问题。核心原因是 Laravel 默认的 CSRF 保护机制会阻止外部 POST 请求,包括 Mollie 的 webhook 调用。教程将详细指导如何通过在 `VerifyCsrfToken` 中间件的 `$except`…

    2025年12月12日
    000
  • php代码执行效率低怎么优化_php代码执行效率提升与优化技巧教程

    答案:PHP性能优化需从数据库、缓存、OPcache和代码逻辑入手。减少循环中SQL查询,使用索引和批量操作;启用OPcache缓存编译码;用内置函数、生成器优化代码;结合Redis等缓存高频数据,并通过工具定位瓶颈。 PHP代码执行效率低通常由不合理的设计、冗余操作或资源浪费导致。优化可以从代码结…

    2025年12月12日
    000
  • NGINX配置导致PHP网站跳转404错误解决方案

    本文针对NGINX配置下PHP网站出现跳转404错误的问题,提供详细的解决方案。通过分析常见的配置错误,例如根目录配置不当和缺失关键的location块,指导读者正确配置NGINX,确保网站能够正确处理URL请求,避免出现404错误,保证网站的正常访问和功能使用。 当你的PHP网站在NGINX服务器…

    2025年12月12日
    000
  • Adminer 自动化登录配置指南

    本教程详细介绍了如何在 adminer 中实现无缝的自动化登录。通过在自定义配置中集成 `permanentlogin()` 方法并结合程序化设置 `$_post[‘auth’]` 数组,用户可以绕过传统的登录界面,直接访问数据库管理界面。文章提供了完整的代码示例和关键注意事…

    2025年12月12日
    000
  • 利用服务器端包含在多HTML页面中高效复用导航栏代码的教程

    在构建多页面网站时,高效复用导航栏等公共组件是提升开发效率和维护一致性的关键。本教程将介绍如何利用服务器端包含(server-side includes, ssi)技术,特别是通过php语言,将导航栏代码集中管理在一个文件中,并在多个html页面中进行引用。这种方法能确保所有页面的导航栏保持同步更新…

    2025年12月12日
    000
  • PHP数据分组:解决多对象数组分组时仅显示单对象的问题

    本教程旨在解决在PHP中根据特定键对数据进行分组时,因数组初始化不当导致每个分组只存储单个对象的问题。我们将深入分析常见的错误模式,并提供正确的数组元素追加方法,确保所有符合条件的记录都能被准确地归类到对应的数组中,从而生成完整且结构化的多对象分组数据。 数据分组场景概述 在Web开发中,我们经常需…

    2025年12月12日
    000
  • PHP/MySQL安全用户密码验证与最佳实践

    本文旨在提供一个关于如何在php和mysql中安全地验证用户密码的教程。我们将深入探讨常见的密码验证错误,强调使用`password_hash()`和`password_verify()`函数进行密码哈希存储的重要性,以及如何通过预处理语句(prepared statements)来防范sql注入攻…

    2025年12月12日
    000
  • 如何配置php网站多终端适配_电脑手机平板等多设备兼容配置方法

    采用响应式框架、CSS媒体查询、服务端设备检测、JavaScript动态调整及移动优先模式,可实现PHP网站在多终端的良好适配。 如果您希望用户在不同设备上访问您的PHP网站时都能获得良好的浏览体验,就需要对网站进行多终端适配。不同屏幕尺寸和分辨率的设备(如电脑、手机和平板)需要不同的布局与资源加载…

    2025年12月12日
    000
  • PHP与AJAX:高效处理多选框数据并执行批量数据库操作

    本教程详细阐述了如何通过ajax技术,将前端html多选框中选中的多个id值安全、高效地发送至php后端。文章将指导读者优化前端html结构、编写正确的jquery ajax请求,并在php中接收并处理这些数据,最终构建一个安全的sql批量操作(如删除)查询,以提升数据库交互效率和数据完整性。 在W…

    2025年12月12日
    000
  • 使用 Nginx 解决 PHP 应用 404 Not Found 问题

    本文旨在解决 Nginx 服务器上 PHP 应用出现 404 Not Found 错误的问题,特别是当用户点击网站上的链接或按钮跳转到其他页面时。文章将分析 Nginx 配置中常见的错误,并提供有效的解决方案,确保 PHP 应用能够正确处理路由请求。 当你在 Nginx 服务器上部署 PHP 应用时…

    2025年12月12日
    000
  • 优化Volley StringRequest处理JSON响应及网络错误诊断

    本文旨在指导开发者如何使用Volley的`StringRequest`正确处理JSON格式的API响应,并深入探讨在遇到“空响应”或特定HTTP错误(如503 Service Unavailable)时,如何进行有效的诊断和排查。内容涵盖JSON解析的最佳实践、异常处理以及常见的网络安全配置考量。 …

    2025年12月12日
    000
  • 实现 Adminer 自动登录:无缝数据库管理配置指南

    本教程详细指导如何在 adminer 中配置自动登录功能,从而无需手动输入凭据即可访问数据库。文章将深入讲解如何通过定制 adminer_object() 函数,利用 permanentlogin() 方法启用持久化登录,并结合 $_post[‘auth’] 数组以编程方式提…

    2025年12月12日
    000
  • 利用Joomla语言覆盖功能动态设置自定义页面标题

    本教程详细阐述了如何在joomla 3.x环境中,通过结合语言覆盖(language overrides)机制和php代码,动态地为页面设置自定义的` `标签。文章将指导读者如何定义语言常量、在代码中动态获取这些常量,并最终使用`jfactory::getdocument()->settitl…

    2025年12月12日
    000
  • 为什么PHP框架支持Composer_PHP框架依赖管理原理解析

    答案:Composer通过标准化依赖管理和自动加载机制,使PHP框架能高效集成、更新和隔离第三方库。它解析composer.json中的依赖关系,下载对应包至vendor目录,并生成autoload.php实现类的自动加载;利用PSR-4规范将命名空间映射到文件路径,减少手动引入;通过compose…

    2025年12月12日
    000
  • PHP中不使用eval()安全计算数学表达式:基于调度场算法的实现

    本文详细介绍了如何在php环境中,不依赖`eval()`函数,安全有效地计算包含四则运算和括号的数学表达式。通过讲解调度场算法(shunting-yard algorithm)将中缀表达式转换为逆波兰表示法(rpn),并进一步实现rpn表达式的求值过程,从而提供一个健壮且可控的表达式计算解决方案。 …

    2025年12月12日
    000
  • PHP:高效地从IP地址范围中随机选取IP的教程

    本文将介绍如何使用php从给定的ip地址范围中高效地随机选择一个ip地址。核心方法是利用`ip2long`将ip地址转换为长整型,通过`random_int`在转换后的数字范围内生成一个随机数,最后使用`long2ip`将随机数转换回ip地址。这种方法避免了生成整个ip范围的巨大内存开销,尤其适用于…

    2025年12月12日
    000
  • 利用PHP SimpleXMLElement与XPath按属性名提取XML数据

    本文将深入探讨如何利用php的simplexmlelement结合xpath技术,高效且精确地从xml文件中提取特定名称的字段值。我们将解决通过属性名直接访问xml节点时遇到的挑战,并提供详细的xpath表达式示例及完整代码,确保开发者能够灵活地按需读取复杂的xml数据结构。 XML数据结构与挑战 …

    2025年12月12日
    000

发表回复

登录后才能评论
关注微信