用 PHP 填充一百万个图像网格以获取互联网历史

10mpage.com:构建一个容纳千万图像的互联网档案馆

我正在开发10mpage.com,旨在捕捉2025年互联网的缩影。任何互联网用户都可以上传64×64像素的小图像,为这个数字档案馆贡献一份力量。

图像添加流程如下:上传的图像首先进入待处理队列。考虑到互联网提交的不可预测性,每个待处理图像都需要人工审核批准。

批准后,图像会被放置到一个网格中。这个网格存储在名为“tiles”的数据库表中,每行记录图像的x和y坐标。

待处理图像可能包含多个1×1的小图块。大型待处理图像会被分割成多个小图块,最终所有图块都统一为1×1大小。

立即学习“PHP免费学习笔记(深入)”;

本文将重点介绍我如何将待处理图块高效地放置到网格中,并优化流程以应对大规模数据处理的挑战。10mpage的目标是容纳一千万个小图块。

预告:我的第一版算法在处理几千个图块时,添加新图块需要几秒钟,随着网格规模的扩大,速度显著下降。我粗略估算了一下,添加一千万个图块需要的时间……几年……

让我们分析一下我的初始方法。它很简单:循环遍历网格,寻找空位并放置待处理图块。这其中包含了一些关于网格如何随着数据增长而扩展的逻辑。

以下是根据待处理图块的宽度和高度查找可用位置的函数:

public function find(int $blockwidth, int $blockheight): array{    $currentmaxx = tile::query()->max('x') ?? 0;    $currentmaxy = tile::query()->max('y') ?? 0;    $currentwidth = $currentmaxx + 1;    $currentheight = $currentmaxy + 1;    $newwidth = $currentwidth;    $newheight = $currentheight;    if ($currentwidth > $currentheight) {        $newheight++;    } elseif ($currentheight > $currentwidth) {        $newwidth++;    } else {        $newwidth++;    }    for ($y = 0; $y canplaceblock($x, $y, $blockwidth, $blockheight)) {                return ['x' => $x, 'y' => $y];            }        }    }    return [0,0];}protected function canplaceblock(int $startx, int $starty, int $blockwidth, int $blockheight): bool{    for ($y = $starty; $y where('x', $x)->where('y', $y)->exists()) {                return false;            }        }    }    return true;}

这种方法在图块数量较少时表现良好,但随着网格规模的扩大,速度急剧下降。这是因为循环总是从零开始遍历。

对于大型图块,一个简单的优化是重写canplaceblock函数,使其只执行单个数据库查询:

public function canplaceblock(int $startx, int $starty, int $blockwidth, int $blockheight): bool{    $ys = range($starty, $starty + $blockheight - 1);    $xs = range($startx, $startx + $blockwidth - 1);    return ! tile::wherein('x', $xs)->wherein('y', $ys)->exists();}

我们还可以尝试从数据库中已存在的最小x和y坐标开始优化find函数:

$maxx = tile::query()->max('x') ?? 1000;$maxy = tile::query()->max('y') ?? 1000;$minx = tile::query()->min('x') ?? 0;$miny = tile::query()->min('y') ?? 0;$occupiedtiles = tile::query()    ->where('x', '>=', $minx)    ->where('x', 'where('y', '>=', $miny)    ->where('y', 'get()    ->mapwithkeys(fn (tile $tile) => [$tile->x.','.$tile->y => true]);// ... (rest of the find function)

然而,这种方法并没有显著改善性能,因为最小值仍然为零,而且加载整个网格会消耗更多内存。此外,仍然需要执行查询来检查整个图块是否合适(仅适用于尺寸大于1的待处理图块,但这尚未实现)。

上述两种解决方案都存在以下两个问题:

图块数量较多时速度慢只能一次放置一个待处理图块

如果我们使用更小的块呢?假设使用100×100的块。这可以解决这两个问题:首先,我们不必检查大于100×100的网格;其次,我们可以使用并发进程将待处理图块放置到不同的块中。

为了实现并发,我们需要确保每个块只被同时访问一次,并且待处理图块不会溢出块。

我将这些块称为“放置块”,并创建了一个名为placement_blocks的新数据库表。对于每个块,我们存储最小/最大x/y坐标和一个布尔值(指示块是否已满)。

一旦所有块都已满,就需要在网格的右侧和底部创建新的块。如下图所示:

用 PHP 填充一百万个图像网格以获取互联网历史

放置过程现在必须从查找可用的放置块开始。我使用递归函数来查找可用块,如果没有可用块,则创建新的放置块:

// ... (find function implementation) ...

这是place函数使用的代码。此函数使用两种锁:全局锁和特定于放置块的锁。它首先锁定全局锁来查找可用的放置块。一旦找到放置块,它就会被锁定,并且全局锁被释放,以便下一个进程也能找到放置块。

// ... (place function implementation) ...

查找可用位置使用我们之前编写的canplaceblock函数,其中图块仅限于放置块内查找。一旦找到位置,它将添加图块并释放放置块锁定。

但是,如果待处理图块不适合可用的放置块,该怎么办?必须等到网格扩展才能放置。目前不支持添加大于单个放置块的待处理图块。

我使用Laravel作业和Laravel Horizon运行此程序,有多个worker处理放置任务。通过这种实现,可以同时放置的图块数量受到worker数量和可用放置块数量的限制。随着项目的发展,我可以增加worker数量来同时放置更多图块,只需确保worker数量等于或小于放置块的数量即可。

感谢您的阅读。如果您喜欢这篇文章,欢迎将您最喜欢的编程语言、加密货币或宠物添加到10mpage中!它是免费的!

以上就是用 PHP 填充一百万个图像网格以获取互联网历史的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1284134.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月11日 00:25:32
下一篇 2025年12月11日 00:25:41

相关推荐

  • PHP如何过滤数据库查询_PHP数据库查询安全规范

    答案是全面采用预处理语句并结合输入验证、最小权限原则和输出转义等多层防御措施。核心在于不信任用户输入,使用PDO或MySQLi的预处理功能将SQL逻辑与数据分离,通过绑定参数防止恶意代码执行;同时对动态查询部分采用白名单机制或动态生成占位符,在确保安全的前提下实现灵活性。 数据库查询的安全性,在我看…

    2025年12月11日
    000
  • PHP怎么设置路由_PHP路由配置与重写方法

    路由是PHP程序响应URL请求的核心机制,它将不同URL映射到对应处理逻辑。在Laravel等框架中,通过Route::get(‘/users/{id}’, ‘UserController@show’)定义路由,框架自动解析URL并传递参数给控制器方法…

    2025年12月11日
    000
  • Laravel 中保持下拉列表选择状态的教程

    本文旨在解决 Laravel 应用中,在表单提交后下拉列表重置的问题。通过利用 Laravel 的请求对象,我们可以轻松地在页面刷新后保持用户在下拉列表中所做的选择,提升用户体验。本文将详细介绍如何实现这一功能,并提供示例代码和注意事项。 在 Laravel 应用中,表单提交后页面刷新,下拉列表恢复…

    2025年12月11日
    000
  • php如何实现一个简单的REST API?php构建RESTful API基础教程

    核心是通过PHP处理HTTP请求并返回JSON响应。需设计URI、选择HTTP方法、实现路由与数据处理。示例中根据GET请求返回用户信息,支持单个或全部用户查询,并返回对应状态码。POST请求通过解析php://input获取JSON数据,验证后创建新用户并返回201状态码。安全方面需过滤输入防止注…

    2025年12月11日
    000
  • Laravel 中表单提交后如何保持下拉列表的选中状态

    本文旨在解决 Laravel 应用中表单提交后下拉列表(select)重置的问题。通过利用 Laravel 提供的 request 对象和旧输入值功能,我们能够轻松地在页面刷新后保持用户在下拉列表中选择的选项,从而提升用户体验。本文将详细介绍如何在视图中正确地处理下拉列表的选中状态,并提供相应的代码…

    2025年12月11日
    000
  • Laravel 中下拉列表选择后重置问题的解决

    本文旨在解决 Laravel 应用中下拉列表在提交后重置的问题。通过利用 Laravel 的请求对象,我们将演示如何在页面刷新后保持用户在下拉列表中选择的选项,从而提升用户体验。文章将提供详细的代码示例和解释,帮助开发者轻松实现该功能。 在 Laravel 应用中,经常会遇到需要在表单提交后保持用户…

    2025年12月11日
    000
  • Laravel Redis队列任务清理指南:兼顾旧版本与Laravel 8+

    本文详细介绍了在Laravel应用中清空Redis队列任务的方法。对于Laravel 8及更高版本,可使用内置的php artisan queue:clear命令;而对于Laravel 8之前的版本,则需通过创建自定义Artisan命令来直接操作Redis键,实现队列任务的快速清理,尤其适用于开发环…

    2025年12月11日
    100
  • PHP如何防止SQL注入_PHP防范SQL注入攻击的核心策略

    防范SQL注入的核心是预处理语句,它通过将SQL逻辑与数据分离,确保用户输入始终作为数据处理;结合参数绑定,使用PDO或MySQLi扩展可有效阻止恶意SQL执行,从根本上避免注入风险。 PHP防范SQL注入的核心策略,毫无疑问是采用预处理语句(Prepared Statements)配合参数绑定(P…

    2025年12月11日
    000
  • 精确控制JavaScript定时任务:实现整点弹窗与桌面通知

    本文详细阐述了如何利用JavaScript精确控制定时任务,以实现在指定时间(例如每小时的整点)触发弹窗或发送桌面通知。通过结合短间隔定时器、日期对象判断和防重复触发机制,解决了传统setInterval无法实现整点触发的问题,并提供了完整的代码示例及桌面通知的实现方法。 1. 理解传统定时器的局限…

    2025年12月11日
    000
  • 在 Laravel Nova 中通过邮件发送文件附件的教程

    在 Laravel Nova 环境下,通过 Mailable 类为电子邮件添加文件附件是一项常见需求。本教程将详细指导您如何实现这一功能,涵盖从 Nova Resource 定义到 Mailable build 方法中附件功能的实现,包括如何获取文件路径、使用 attach 方法以及相关注意事项,确…

    2025年12月11日
    000
  • Laravel教程:高效展示项目标题及其关联问题列表

    本教程旨在指导您如何在Laravel应用中高效地展示特定项目的标题及其关联问题列表。通过优化控制器逻辑,将完整的项目模型传递至视图,并利用Eloquent关系在视图中直接访问项目属性及循环其关联问题,从而实现代码的简洁与逻辑的清晰,提升开发效率与代码可维护性。 在构建项目管理或任务追踪系统时,一个常…

    2025年12月11日
    000
  • php中的匿名函数(闭包)如何使用?PHP匿名函数与闭包使用指南

    答案:PHP匿名函数即闭包,可赋值给变量、作为参数传递,并通过use捕获外部变量;值捕获复制变量,引用捕获(&)可修改外部变量;常用于回调、事件处理和路由定义;需注意避免过度嵌套、误用引用及调试困难,建议保持简洁、明确use变量并合理使用类型提示。 PHP中的匿名函数,通常我们称之为闭包(C…

    2025年12月11日
    000
  • php如何统计代码执行时间 php脚本性能分析与执行时间计算

    使用microtime()或hrtime()测量PHP代码执行时间,结合Xdebug、Blackfire、Tideways、xhprof/xhgui或APM工具进行性能分析,通过优化数据库查询、循环、算法及使用缓存等方式提升性能。 直接告诉你,用 microtime() 函数,配合一些简单的数学运算…

    2025年12月11日
    000
  • php中的魔术方法__get和__set怎么用?PHP魔术方法__get与__set使用指南

    __get和__set用于拦截对象中不存在或不可访问属性的读写操作,实现动态属性访问、数据验证与惰性加载,常用于配置管理、ORM及代理模式,但需注意性能开销、可读性及IDE支持等问题。 PHP中的魔术方法 __get 和 __set 主要用于处理对象中“不存在”或“不可访问”的属性。简单来说,当你尝…

    2025年12月11日
    000
  • MySQL与PHP:高效判断指定时间是否落在数据库日期区间内

    本教程详细阐述如何利用MySQL的BETWEEN操作符和DATE()函数,结合PHP实现高效且准确的日期时间区间判断。文章将指导读者优化SQL查询,避免冗余格式化,并区分全天候与精确时间比较两种场景。同时,将介绍通过SELECT 1 LIMIT 1提升查询存在性判断的性能,确保在数据库中快速验证指定…

    2025年12月11日
    000
  • 在Laravel应用中获取调用辅助函数的控制器和方法

    本文探讨了在Laravel辅助函数中,如何在不显式传递参数的情况下,动态获取调用该辅助函数的控制器名称及其方法。通过利用PHP的调试回溯机制,特别是借助spatie/backtrace包,可以高效且可靠地实现这一目标。文章提供了两种实现方案:直接在辅助函数中集成回溯逻辑,以及通过修改Laravel的…

    2025年12月11日
    000
  • 高效管理Laravel数据库队列:取消与清理策略

    本文深入探讨了Laravel框架中基于数据库的队列任务管理,特别是如何有效取消和清理待处理及已失败的任务。我们将详细介绍Laravel Artisan命令在批量管理任务方面的应用,并阐明在特定场景下,如何通过直接数据库操作来精确取消单个待处理任务,同时强调了操作的注意事项与最佳实践,以确保队列系统的…

    2025年12月11日
    000
  • Laravel 数据库队列:取消延迟任务与管理策略

    本文详细探讨了在 Laravel 应用程序中使用数据库队列时,如何有效取消和管理待处理任务。我们将介绍直接删除数据库记录的原理,并重点讲解 php artisan queue:clear 等命令行工具,以确保任务取消的正确性和系统稳定性,尤其针对延迟任务和重试机制。 在使用 laravel 构建应用…

    2025年12月11日
    000
  • 在 Laravel 中实现最近浏览商品功能及常见问题解决

    本文详细介绍了如何在 Laravel 7+ 中利用 Cookie 实现“最近浏览商品”功能。教程涵盖了从商品数据存储、Cookie 管理(包括 JSON 编码/解码、去重、数量限制)到前端 Blade 模板展示的完整流程。特别强调了在操作 Cookie 时保持键名一致性的重要性,以避免常见的逻辑错误…

    2025年12月11日
    000
  • php如何设置HTTP状态码?PHP HTTP状态码设置指南

    PHP中设置HTTP状态码主要用header()或http_response_code()函数,后者更简洁安全;需避免输出后设状态码、滥用302重定向等误区;在RESTful API中应准确使用状态码以明确请求结果、简化客户端逻辑;结合自定义错误页面和异常处理机制可提升用户体验与系统健壮性。 在PH…

    2025年12月11日
    000

发表回复

登录后才能评论
关注微信