用 PHP 填充一百万个图像网格以获取互联网历史

10mpage.com:构建一个容纳千万图像的互联网档案馆

我正在开发10mpage.com,旨在捕捉2025年互联网的缩影。任何互联网用户都可以上传64×64像素的小图像,为这个数字档案馆贡献一份力量。

图像添加流程如下:上传的图像首先进入待处理队列。考虑到互联网提交的不可预测性,每个待处理图像都需要人工审核批准。

批准后,图像会被放置到一个网格中。这个网格存储在名为“tiles”的数据库表中,每行记录图像的x和y坐标。

待处理图像可能包含多个1×1的小图块。大型待处理图像会被分割成多个小图块,最终所有图块都统一为1×1大小。

立即学习“PHP免费学习笔记(深入)”;

本文将重点介绍我如何将待处理图块高效地放置到网格中,并优化流程以应对大规模数据处理的挑战。10mpage的目标是容纳一千万个小图块。

预告:我的第一版算法在处理几千个图块时,添加新图块需要几秒钟,随着网格规模的扩大,速度显著下降。我粗略估算了一下,添加一千万个图块需要的时间……几年……

让我们分析一下我的初始方法。它很简单:循环遍历网格,寻找空位并放置待处理图块。这其中包含了一些关于网格如何随着数据增长而扩展的逻辑。

以下是根据待处理图块的宽度和高度查找可用位置的函数:

public function find(int $blockwidth, int $blockheight): array{    $currentmaxx = tile::query()->max('x') ?? 0;    $currentmaxy = tile::query()->max('y') ?? 0;    $currentwidth = $currentmaxx + 1;    $currentheight = $currentmaxy + 1;    $newwidth = $currentwidth;    $newheight = $currentheight;    if ($currentwidth > $currentheight) {        $newheight++;    } elseif ($currentheight > $currentwidth) {        $newwidth++;    } else {        $newwidth++;    }    for ($y = 0; $y canplaceblock($x, $y, $blockwidth, $blockheight)) {                return ['x' => $x, 'y' => $y];            }        }    }    return [0,0];}protected function canplaceblock(int $startx, int $starty, int $blockwidth, int $blockheight): bool{    for ($y = $starty; $y where('x', $x)->where('y', $y)->exists()) {                return false;            }        }    }    return true;}

这种方法在图块数量较少时表现良好,但随着网格规模的扩大,速度急剧下降。这是因为循环总是从零开始遍历。

对于大型图块,一个简单的优化是重写canplaceblock函数,使其只执行单个数据库查询:

public function canplaceblock(int $startx, int $starty, int $blockwidth, int $blockheight): bool{    $ys = range($starty, $starty + $blockheight - 1);    $xs = range($startx, $startx + $blockwidth - 1);    return ! tile::wherein('x', $xs)->wherein('y', $ys)->exists();}

我们还可以尝试从数据库中已存在的最小x和y坐标开始优化find函数:

$maxx = tile::query()->max('x') ?? 1000;$maxy = tile::query()->max('y') ?? 1000;$minx = tile::query()->min('x') ?? 0;$miny = tile::query()->min('y') ?? 0;$occupiedtiles = tile::query()    ->where('x', '>=', $minx)    ->where('x', 'where('y', '>=', $miny)    ->where('y', 'get()    ->mapwithkeys(fn (tile $tile) => [$tile->x.','.$tile->y => true]);// ... (rest of the find function)

然而,这种方法并没有显著改善性能,因为最小值仍然为零,而且加载整个网格会消耗更多内存。此外,仍然需要执行查询来检查整个图块是否合适(仅适用于尺寸大于1的待处理图块,但这尚未实现)。

上述两种解决方案都存在以下两个问题:

图块数量较多时速度慢只能一次放置一个待处理图块

如果我们使用更小的块呢?假设使用100×100的块。这可以解决这两个问题:首先,我们不必检查大于100×100的网格;其次,我们可以使用并发进程将待处理图块放置到不同的块中。

为了实现并发,我们需要确保每个块只被同时访问一次,并且待处理图块不会溢出块。

我将这些块称为“放置块”,并创建了一个名为placement_blocks的新数据库表。对于每个块,我们存储最小/最大x/y坐标和一个布尔值(指示块是否已满)。

一旦所有块都已满,就需要在网格的右侧和底部创建新的块。如下图所示:

用 PHP 填充一百万个图像网格以获取互联网历史

放置过程现在必须从查找可用的放置块开始。我使用递归函数来查找可用块,如果没有可用块,则创建新的放置块:

// ... (find function implementation) ...

这是place函数使用的代码。此函数使用两种锁:全局锁和特定于放置块的锁。它首先锁定全局锁来查找可用的放置块。一旦找到放置块,它就会被锁定,并且全局锁被释放,以便下一个进程也能找到放置块。

// ... (place function implementation) ...

查找可用位置使用我们之前编写的canplaceblock函数,其中图块仅限于放置块内查找。一旦找到位置,它将添加图块并释放放置块锁定。

但是,如果待处理图块不适合可用的放置块,该怎么办?必须等到网格扩展才能放置。目前不支持添加大于单个放置块的待处理图块。

我使用Laravel作业和Laravel Horizon运行此程序,有多个worker处理放置任务。通过这种实现,可以同时放置的图块数量受到worker数量和可用放置块数量的限制。随着项目的发展,我可以增加worker数量来同时放置更多图块,只需确保worker数量等于或小于放置块的数量即可。

感谢您的阅读。如果您喜欢这篇文章,欢迎将您最喜欢的编程语言、加密货币或宠物添加到10mpage中!它是免费的!

以上就是用 PHP 填充一百万个图像网格以获取互联网历史的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1284134.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
如何在 Laravel 示例中使用 Factory Tinker 生成假数据
上一篇 2025年12月11日 00:25:32
在 PHP 中使用后期静态绑定的示例
下一篇 2025年12月11日 00:25:41

相关推荐

  • composer require-dev和require有什么不同_Composer Require与Require-Dev区别解析

    require用于声明项目运行必需的依赖,如框架、数据库组件和第三方SDK,这些包会随项目部署到生产环境;2. require-dev用于声明仅在开发和测试阶段需要的工具,如PHPUnit、PHPStan、Faker等,不会默认部署到生产环境;3. 安装时composer install根据环境决定…

    2026年5月10日
    1000
  • 开源免费PHP工具 PHP开发效率提升利器

    推荐开源免费PHP开发工具以提升效率:VS Code、Sublime Text轻量高效,PhpStorm专业强大;调试用Xdebug、Kint、Ray;依赖管理选Composer;代码质量工具包括PHPStan、Psalm、PHP_CodeSniffer;数据库管理可用%ignore_a_1%MyA…

    2026年5月10日
    000
  • 松下案例入选《2025企业社会责任竞争力指数报告》

    松下案例入选《2025企业社会责任竞争力指数报告》松下案例入选《2025企业社会责任竞争力指数报告》松下案例入选《2025企业社会责任竞争力指数报告》松下案例入选《2025企业社会责任竞争力指数报告》

    11月14日,中国新闻社《中国新闻周刊》在北京成功举办了第二十一届企业社会责任系列活动·2025责任之星特别节目。活动以“致明天:焕新责任竞争力”为主题,汇聚了来自政府、企业及学术界的多位代表,共同探讨新时代下企业如何通过责任创新打造核心竞争力。松下电器(中国)有限公司总裁赵炳弟作为企业界代表受邀出…

    2026年5月10日 用户投稿
    000
  • html标签如何读_HTML标签(语义化/结构)阅读与理解方法

    答案是掌握HTML标签的语义化含义与结构作用。理解HTML需从语义化入手,使用如article、nav、header等标签准确表达内容意义,提升可访问性、SEO和代码可维护性;阅读时应从外到内分析结构,识别页面骨架,区分语义标签与非语义标签(如div、span)的合理使用场景,避免仅凭外观选择标签,…

    2026年5月10日
    000
  • 我有时使用 awk 而不是 Python 的四个原因

    Python 是一门强大的编程语言,但在某些特定场景下,Awk 的优势更为显著,尤其体现在可移植性、生命周期、代码简洁性和与其他工具的互操作性方面。 Python 脚本通常具有良好的可移植性,但并非总能在所有环境中完美运行,例如流行的 Docker 基础镜像 (如 Debian 和 Alpine)。…

    2026年5月10日
    000
  • 深入理解 Laravel Session::put:避免常见陷阱与实现表单限流

    本文旨在深入探讨 laravel 框架中 `session::put` 方法的正确用法及其常见误区。针对用户在实现表单提交限流时遇到的问题,详细阐述了 `session::put` 必须提供键值对的原理,并提供了如何在控制器中利用会话机制有效防止重复提交的实战代码示例。通过本文,读者将掌握 lara…

    2026年5月10日
    000
  • Voyager 中关联关系的翻译问题解决方案

    本文档旨在解决在使用 TCGVoyager 管理后台时,关联模型无法正确翻译的问题。主要针对 Laravel 项目中,使用 Voyager 1.4 版本以及 Laravel 8.0 版本,并且已经配置多语言支持的情况下,如何确保关联关系中的可翻译字段能够根据当前应用语言环境进行正确翻译。通过修改 B…

    2026年5月10日
    000
  • 李彦宏:2025年是萝卜快跑的扩张之年 将寻找合作方

    百度计划2025年大力扩张自动驾驶出行服务平台“萝卜快跑”。百度ceo李彦宏近日在业绩会上宣布,将与电信运营商、出租车公司及其他车队运营商合作,扩大市场份额,让更多用户体验自动驾驶技术。 这对于萝卜快跑而言是至关重要的发展阶段,预计未来车队规模和服务量将实现飞速增长。 ☞☞☞AI 智能聊天, 问答助…

    2026年5月10日
    000
  • 为什么专注如此重要?

    在快节奏的数字时代,程序员能否保持专注直接影响着代码质量、项目进度和错误率。 高效专注,才能在开发过程中游刃有余。本文将分享一些实用技巧,助您提升编程专注力,高效完成任务。 专注力为何如此重要? 专注力是程序员的核心竞争力。编码需要高度集中,处理细节、逻辑和问题,稍一分神就可能导致错误百出,返工耗时…

    2026年5月10日
    300
  • btc现在每年产出多少 一文带你了解BTC每年产出量

    了解BTC的年产出量对于理解其供应机制至关重要。它的产出并非随意而为,而是由其底层代码严格限定的,具有高度的可预测性。本文将为您详细拆解BTC年产出量的计算方式,并阐明其背后的核心机制。 %ignore_a_1%全球主流交易平台推荐 1、欧易okx 官网入口: APP下载链接: 2、币安Binanc…

    2026年5月10日
    200
  • HTX交易APP最新官网 火币 APP下载+注册完整手册

    htx交易app是火币全球站的官方移动端应用,作为领先的加密货币交易平台,它提供安全、便捷的数字资产买卖服务。下载和注册htx app是进入加密世界的重要一步,本手册将详细指导您从官网获取最新版本、完成安装以及顺利注册账户。通过本指南,您将掌握高效操作技巧,确保交易顺利进行。无论新手还是资深用户,此…

    2026年5月10日
    200
  • 优化 Laravel Eloquent 查询:高效构建用户排行榜数据

    本教程详细讲解如何优化 Laravel Eloquent 查询以高效生成基于关联记录计数的排行榜。通过识别并消除冗余的 whereHas 子句,并巧妙利用 withCount 的条件闭包,我们能显著提升查询性能,大幅缩短数据获取时间,从而改善用户体验并降低数据库负载。 在 laravel 应用开发中…

    2026年5月10日
    300
  • XMR币是否能涨到1000美元

    xmr币,也就是门罗币(monero),是加密货币领域中备受关注的一种数字资产。它以强大的隐私保护功能著称,在强调匿名交易的市场中占据了一席之地。 那么,xmr币有没有可能达到1000美元的价格?这个问题需要从多个维度来分析。 从需求角度看,随着人们对数据隐私和金融自主权的关注日益增强,尤其是在信息…

    2026年5月10日
    000
  • 使用 React 和 Pushpad 进行 Web 推送通知

    本教程演示如何在React网站上轻松实现用户订阅网页推送通知功能。我们将创建一个React组件,方便用户订阅/取消订阅推送通知。 我们将使用Pushpad SDK来创建和管理推送订阅。 一、配置Pushpad JavaScript SDK 首先,在网站根目录添加名为service-worker.js…

    2026年5月10日
    300
  • 它的未来:自动化和人工智能如何改变发展

    自动化与人工智能:IT领域的未来发展 自动化和人工智能(AI)正在深刻地改变着软件开发和IT专业人员的工作方式。从自动化重复性任务到将AI工具融入开发流程,这些技术为IT行业带来了新的机遇和挑战。 1. DevOps中的自动化:简化开发流程 自动化正在彻底改变开发人员管理开发和部署流程的方式。持续集…

    2026年5月10日
    000
  • 以太坊3.0升级解读:2025年POS机制带来的影响与机遇

    预计到2025年,以太坊在权益证明(pos)机制下的持续升级,将主要围绕实现大规模扩容、增强网络去中心化和可持续性展开。这不仅会重塑以太坊的底层架构,更将为整个生态系统,尤其是加密货币交易所、开发者及投资者,带来一系列深刻的影响与前所未有的机遇。 2025年虚拟货币官网app地址: 币安:  欧易:…

    2026年5月10日
    500
  • 告别重复:使用Laravel Precognition统一前后端API验证

    本文旨在解决在Laravel后端与前端API交互中,如何高效复用后端验证规则的挑战。传统方案常限于表单元素,难以覆盖所有API请求。通过引入Laravel Precognition,开发者能够实现后端验证逻辑在前端的无缝应用,避免规则重复编写,从而提升开发效率与代码一致性,确保所有API请求的数据完…

    2026年5月10日
    200
  • 为什么 TypeScript 比 JavaScript 更好

    javascript 长期以来一直是 web 开发的基石,支持从小型脚本到大型应用程序的各种项目。然而,随着项目规模的扩大,javascript 的动态类型和缺乏结构性可能会成为开发的瓶颈。typescript 应运而生,它凭借静态类型检查和强大的工具集,迅速成为许多开发者构建可靠、可扩展应用程序的…

    2026年5月10日
    300
  • 官方41币是什么?如何在Solana上购买41官方币?购买指南

    官方41币是Solana链上高风险迷因代币,需用Phantom等账户准备SOL并经Jupiter等DEX兑换,全程自主掌控私钥与助记词,交易不可逆。 官方41币是在solana网络上的社区驱动型数字资产的一种部署,通常被视为一种迷因(meme)代币。获取它需要准备一个兼容solana的数字资产容器,…

    2026年5月10日
    200
  • Laravel Session::put 正确用法详解与常见误区规避

    本文详细探讨了 laravel 中 `session::put` 方法的正确用法,特别指出在仅提供键名而未指定值时可能导致会话数据未被正确设置的问题。通过示例代码,阐述了如何为会话数据赋予明确的值,并演示了如何正确地检查和获取会话数据,以确保会话管理功能按预期工作,有效避免常见的会话操作错误。 La…

    2026年5月10日
    000

发表回复

登录后才能评论
关注微信