使用PHP正则表达式安全解析自定义Liquid风格标签

使用PHP正则表达式安全解析自定义Liquid风格标签

本文将指导您如何使用PHP正则表达式安全地解析和转换自定义的{%github user/repo %} Liquid风格标签,将其转换为标准的GitHub链接。通过采用精确的正则表达式和preg_match_all函数,可以有效避免贪婪匹配问题,并确保提取的数据格式正确且安全,从而构建一个健壮的标签解析机制。

在内容管理系统或模板引擎中,我们经常需要解析自定义的标签,例如将{%github user/repo %}这样的标记转换为标准的html链接repo。然而,在实现这一功能时,如果正则表达式构造不当,可能会导致安全漏洞或不准确的解析结果。

初始尝试与常见陷阱

一个常见的错误是使用过于宽泛的正则表达式,例如利用.*?(非贪婪匹配)来捕获标签内容。考虑以下代码片段:

function parseliquid($string){    $regexp = '/{%github (.*?)%}/'; // 这里的(.*?)是问题所在    preg_match($regexp, $string, $matches);    return $matches;}var_dump(parseliquid("## Hello {%github isn't/safe {%github repo/user %} %}"));

当输入字符串为## Hello {%github isn’t/safe {%github repo/user %} %}时,我们期望提取的是repo/user,但实际输出却是:

array(2) {  [0]=> string(41) "{%github isn't/safe {%github repo/user %}"  [1]=> string(30) "isn't/safe {%github repo/user "}

问题在于.*?虽然是非贪婪的,但它会匹配从第一个{%github到第一个%}之间的所有字符。在存在嵌套或多个相似模式时,它无法智能地识别出我们真正想要捕获的特定格式内容。更重要的是,.*?允许匹配任何字符,这可能导致注入不安全的内容,从而带来潜在的安全风险。

构建健壮且安全的解析函数

为了解决上述问题,我们需要一个更精确的正则表达式,它不仅能正确捕获目标内容,还能通过模式匹配对内容进行初步的格式验证,从而提高安全性。

立即学习“PHP免费学习笔记(深入)”;

以下是一个推荐的解决方案,它使用preg_match_all函数和更严格的正则表达式:

<?php/** * 从字符串中提取所有GitHub仓库名称并转换为完整的GitHub URL。 * * @param string $value 包含自定义GitHub标签的输入字符串。 * @return array 包含GitHub URL的数组,如果未找到则返回空数组。 */function getRepositoryNames(string $value): array{    // 定义精确的正则表达式来匹配GitHub仓库格式    // {%githubs : 匹配字面量 {%github 和一个空格    // (?...) : 命名捕获组,名为 'repo'    // [a-z0-9-_]+ : 匹配一个或多个小写字母、数字、连字符或下划线 (用于用户名或仓库名)    // / : 匹配字面量斜杠    // [a-z0-9-_]+ : 匹配一个或多个小写字母、数字、连字符或下划线 (用于仓库名)    // s+} : 匹配一个或多个空格和字面量 %}    preg_match_all('/{%githubs(?[a-z0-9-_]+/[a-z0-9-_]+)s+}/', $value, $matched);    // 检查是否成功捕获到 'repo' 命名组    if (!isset($matched['repo'])) {        return [];    }    // 使用 array_map 将捕获到的仓库名称转换为完整的GitHub URL    return array_map(static fn ($item) => 'https://github.com/'.$item, $matched['repo']);}// 示例用法$inputString = '{%github isnt/safe %} {%github repo/user1-test %} This is another tag {%github my-org/my-project %}';var_dump(getRepositoryNames($inputString));

代码解析:

preg_match_all: 这个函数用于在字符串中查找所有匹配正则表达式的子串,而不是只找第一个。这对于处理多个自定义标签的场景至关重要。正则表达式 /{%githubs(?[a-z0-9-_]+/[a-z0-9-_]+)s+}/:{%githubs: 精确匹配字面量{%github后跟一个空格。用于转义特殊字符{和%。(?…): 这是一个命名捕获组。它将匹配到的内容存储在一个名为repo的数组键下,方便后续访问。[a-z0-9-_]+/[a-z0-9-_]+: 这是整个正则表达式中最关键的部分。它定义了GitHub仓库名称的预期格式。[a-z0-9-_]+: 匹配一个或多个小写字母、数字、连字符或下划线。这通常是GitHub用户名或仓库名的有效字符集。/: 匹配字面量斜杠/,用于分隔用户名和仓库名。[a-z0-9-_]+: 再次匹配一个或多个有效字符,用于仓库名。s+}: 匹配一个或多个空格后跟字面量%}。$matched[‘repo’]: preg_match_all会将所有命名捕获组的内容存储在 $matched 数组中,键名即为捕获组的名称。array_map: 这个函数将 $matched[‘repo’] 数组中的每个仓库名称作为参数,传递给一个匿名函数。匿名函数负责将每个仓库名称前加上 https://github.com/,从而生成完整的GitHub URL。

示例输出:

array(3) {  [0]=> string(28) "https://github.com/isnt/safe"  [1]=> string(34) "https://github.com/repo/user1-test"  [2]=> string(36) "https://github.com/my-org/my-project"}

注意事项与总结

安全性提升: 通过限制捕获组(?[a-z0-9-_]+/[a-z0-9-_]+)的匹配模式,我们确保了只有符合特定格式(即有效的GitHub user/repo格式)的字符串才会被提取。这大大降低了恶意注入或意外解析错误数据的风险。精确匹配: 该方法避免了.*?可能导致的贪婪匹配问题,确保了在复杂字符串中也能准确提取所需内容。灵活性: preg_match_all可以轻松处理字符串中出现的多个自定义标签。扩展性: 如果需要支持其他类型的Liquid风格标签(例如{%youtube video_id %}),可以根据需要修改或添加新的正则表达式。输出编码: 如果将解析后的URL直接嵌入到HTML中,请务必使用htmlspecialchars()等函数对URL进行适当的HTML实体编码,以防止跨站脚本(XSS)攻击。

通过采用这种结合了精确正则表达式和preg_match_all的策略,我们可以构建一个既安全又高效的PHP函数,用于解析和转换自定义的Liquid风格标签。

以上就是使用PHP正则表达式安全解析自定义Liquid风格标签的详细内容,更多请关注php中文网其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1322918.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月12日 09:02:06
下一篇 2025年12月12日 09:02:24

相关推荐

  • CSS 元素设置 10em 和 transition 后为何没有放大效果?

    CSS 元素设置 10em 和 transition 后为何无放大效果? 你尝试设置了一个 .box 类,其中包含字体大小为 10em 和过渡持续时间为 2 秒的文本。当你载入到页面时,它没有像 YouTube 视频中那样产生放大效果。 原因可能在于你将 CSS 直接写在页面中 在你的代码示例中,C…

    2025年12月24日
    400
  • 为什么我的 em 和 transition 设置后元素没有放大?

    元素设置 em 和 transition 后不放大 一个 youtube 视频中展示了设置 em 和 transition 的元素在页面加载后会放大,但同样的代码在提问者电脑上没有达到预期效果。 可能原因: 问题在于 css 代码的位置。在视频中,css 被放置在单独的文件中并通过 link 标签引…

    2025年12月24日
    100
  • HTML、CSS 和 JavaScript 中的简单侧边栏菜单

    构建一个简单的侧边栏菜单是一个很好的主意,它可以为您的网站添加有价值的功能和令人惊叹的外观。 侧边栏菜单对于客户找到不同项目的方式很有用,而不会让他们觉得自己有太多选择,从而创造了简单性和秩序。 今天,我将分享一个简单的 HTML、CSS 和 JavaScript 源代码来创建一个简单的侧边栏菜单。…

    2025年12月24日
    200
  • 前端代码辅助工具:如何选择最可靠的AI工具?

    前端代码辅助工具:可靠性探讨 对于前端工程师来说,在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而,并非所有工具都能提供同等的可靠性。 个性化需求 关于哪个AI工具最可靠,这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素: 立…

    2025年12月24日
    300
  • 带有 HTML、CSS 和 JavaScript 工具提示的响应式侧边导航栏

    响应式侧边导航栏不仅有助于改善网站的导航,还可以解决整齐放置链接的问题,从而增强用户体验。通过使用工具提示,可以让用户了解每个链接的功能,包括设计紧凑的情况。 在本教程中,我将解释使用 html、css、javascript 创建带有工具提示的响应式侧栏导航的完整代码。 对于那些一直想要一个干净、简…

    2025年12月24日
    000
  • 布局 – CSS 挑战

    您可以在 github 仓库中找到这篇文章中的所有代码。 您可以在这里查看视觉效果: 固定导航 – 布局 – codesandbox两列 – 布局 – codesandbox三列 – 布局 – codesandbox圣杯 &#8…

    2025年12月24日
    000
  • 隐藏元素 – CSS 挑战

    您可以在 github 仓库中找到这篇文章中的所有代码。 您可以在此处查看隐藏元素的视觉效果 – codesandbox 隐藏元素 hiding elements hiding elements hiding elements hiding elements hiding element…

    2025年12月24日
    400
  • 居中 – CSS 挑战

    您可以在 github 仓库中找到这篇文章中的所有代码。 您可以在此处查看垂直中心 – codesandbox 和水平中心的视觉效果。 通过 css 居中 垂直居中 centering centering centering centering centering centering立即…

    2025年12月24日 好文分享
    300
  • 如何在 Laravel 框架中轻松集成微信支付和支付宝支付?

    如何用 laravel 框架集成微信支付和支付宝支付 问题:如何在 laravel 框架中集成微信支付和支付宝支付? 回答: 建议使用 easywechat 的 laravel 版,easywechat 是一个由腾讯工程师开发的高质量微信开放平台 sdk,已被广泛地应用于许多 laravel 项目中…

    2025年12月24日
    000
  • 如何在移动端实现子 div 在父 div 内任意滑动查看?

    如何在移动端中实现让子 div 在父 div 内任意滑动查看 在移动端开发中,有时我们需要让子 div 在父 div 内任意滑动查看。然而,使用滚动条无法实现负值移动,因此需要采用其他方法。 解决方案: 使用绝对布局(absolute)或相对布局(relative):将子 div 设置为绝对或相对定…

    2025年12月24日
    000
  • 移动端嵌套 DIV 中子 DIV 如何水平滑动?

    移动端嵌套 DIV 中子 DIV 滑动 在移动端开发中,遇到这样的问题:当子 DIV 的高度小于父 DIV 时,无法在父 DIV 中水平滚动子 DIV。 无限画布 要实现子 DIV 在父 DIV 中任意滑动,需要创建一个无限画布。使用滚动无法达到负值,因此需要使用其他方法。 相对定位 一种方法是将子…

    2025年12月24日
    000
  • 移动端项目中,如何消除rem字体大小计算带来的CSS扭曲?

    移动端项目中消除rem字体大小计算带来的css扭曲 在移动端项目中,使用rem计算根节点字体大小可以实现自适应布局。但是,此方法可能会导致页面打开时出现css扭曲,这是因为页面内容在根节点字体大小赋值后重新渲染造成的。 解决方案: 要避免这种情况,将计算根节点字体大小的js脚本移动到页面的最前面,即…

    2025年12月24日
    000
  • Nuxt 移动端项目中 rem 计算导致 CSS 变形,如何解决?

    Nuxt 移动端项目中解决 rem 计算导致 CSS 变形 在 Nuxt 移动端项目中使用 rem 计算根节点字体大小时,可能会遇到一个问题:页面内容在字体大小发生变化时会重绘,导致 CSS 变形。 解决方案: 可将计算根节点字体大小的 JS 代码块置于页面最前端的 标签内,确保在其他资源加载之前执…

    2025年12月24日
    200
  • Nuxt 移动端项目使用 rem 计算字体大小导致页面变形,如何解决?

    rem 计算导致移动端页面变形的解决方法 在 nuxt 移动端项目中使用 rem 计算根节点字体大小时,页面会发生内容重绘,导致页面打开时出现样式变形。如何避免这种现象? 解决方案: 移动根节点字体大小计算代码到页面顶部,即 head 中。 原理: flexível.js 也遇到了类似问题,它的解决…

    2025年12月24日
    000
  • 形状 – CSS 挑战

    您可以在 github 仓库中找到这篇文章中的所有代码。 您可以在此处查看 codesandbox 的视觉效果。 通过css绘制各种形状 如何在 css 中绘制正方形、梯形、三角形、异形三角形、扇形、圆形、半圆、固定宽高比、0.5px 线? shapes 0.5px line .square { w…

    2025年12月24日
    000
  • 使用 element-ui Table 组件合并单元格时,最后一行高度异常该如何解决?

    element-ui table 组件合并单元格导致最后一行高度异常的解决之道 在 element-ui 的表格组件中,利用 objectspanmethod 用于合并单元格。但是,在合并过程中,用户遇到了最后一行高度异常的问题,导致其高度远高于其他行。 问题分析 根据用户提供的代码示例,在合并第 …

    2025年12月24日
    000
  • Element-UI Table 合并单元格导致最后一行高度异常如何解决?

    element-ui table 合并单元格导致最后一行高度异常的解决方法 使用 element-ui 的 table 组件时,对某些列进行合并单元格可能会在最后一行引起异常高度问题。例如,在合并最后一列的情况下,最后一行的文本可能会超出边界。 出现这种情况的原因是: 在对合并行进行样式设置时,使用…

    2025年12月24日
    200
  • Element UI 表格合并单元格最后一行高度异常如何解决?

    element ui 表格合并单元格最后一行高度异常问题 element ui 表格使用 rowspan 属性合并单元格时,最后一行的高度可能出现比其他行高的异常情况。 原因: element ui 表格合并单元格时,需要通过 objectspanmethod 方法指定合并单元格的起始行和结束行,而…

    2025年12月24日
    000
  • 有哪些美观的开源数字大屏驾驶舱框架?

    开源数字大屏驾驶舱框架推荐 问题:有哪些美观的开源数字大屏驾驶舱框架? 答案: 资源包 [弗若恩智能大屏驾驶舱开发资源包](https://www.fanruan.com/resource/152) 软件 [弗若恩报表 – 数字大屏可视化组件](https://www.fanruan.c…

    2025年12月24日
    000
  • 如何让 CSS3 的 video 标签自动播放视频并播放声音?

    自动播放视频带音效:突破浏览器的限制 想要在 CSS3 的 video 标签中自动播放视频,同时播放声音,开发人员可能会面临浏览器默认禁用音频播放的限制。 浏览器设置 浏览器将音频播放的控制权交给用户,这意味着开发人员无法在未经用户明确允许的情况下自动播放带声音的视频。用户可以通过浏览器设置来启用自…

    2025年12月24日
    000

发表回复

登录后才能评论
关注微信