PHP高效提取两个字符串中的公共单词

PHP高效提取两个字符串中的公共单词

本教程旨在介绍如何在php中高效地从两个给定字符串中提取所有共同的单词。我们将探讨一种避免传统循环、利用内置函数快速实现此目标的方法,通过实际代码示例展示如何比较源字符串与用户字符串,并输出它们共有的词汇,从而优化字符串处理效率。

引言

在PHP开发中,经常会遇到需要对字符串进行处理和分析的场景。其中一个常见的需求是,从两个给定的字符串中找出所有共同存在的单词。例如,你可能有一个原始文本字符串和一个用户输入的字符串,需要快速识别出两者之间共享的关键词。传统的做法可能涉及嵌套循环和逐词比较,但这在处理大量数据时效率低下。本教程将展示一种更简洁、更高效的PHP实现方式。

问题描述与解决方案核心

我们的目标是,给定两个字符串,例如:$str_original = ‘This is first string’;$user_string = ‘This is user string’;

我们期望得到它们共同的单词,即:’This is string’

解决方案的核心思想是:

将每个字符串分解(或称“分词”)成独立的单词数组。利用PHP内置的数组函数 array_intersect() 来找出这两个单词数组的交集。将交集结果(即共同单词数组)重新组合成一个字符串。

这种方法避免了手动循环,而是依赖于PHP底层优化过的数组操作函数,从而大大提高了效率和代码可读性

实现步骤与代码示例

我们将创建一个名为 getCommonWords 的函数来封装上述逻辑。

立即学习“PHP免费学习笔记(深入)”;

1. 定义 getCommonWords 函数


运行上述代码,你将得到预期的输出:

原始字符串: This is first string用户字符串: This is user string共同单词: This is string--- 更多示例 ---字符串1: apple banana orange grape字符串2: banana kiwi orange mango共同单词: banana orange字符串1: The quick brown fox jumps over the lazy dog字符串2: A quick brown cat runs under the tree共同单词: quick brown the

注意事项与进阶考量

大小写敏感性: explode() 和 array_intersect() 默认是大小写敏感的。这意味着 “String” 和 “string” 会被视为不同的单词。如果需要实现大小写不敏感的比较,可以在 explode() 之后,使用 array_map(‘strtolower’, $words) 将所有单词转换为小写,然后再进行交集运算。

function getCommonWordsCaseInsensitive(string $string1, string $string2): string{    $words1 = array_map('strtolower', explode(' ', $string1));    $words2 = array_map('strtolower', explode(' ', $string2));    $commonWordsArray = array_intersect($words1, $words2);    return implode(' ', $commonWordsArray);}$str1_ci = 'This is First String';$str2_ci = 'This is user string';echo "大小写不敏感共同单词: " . getCommonWordsCaseInsensitive($str1_ci, $str2_ci) . PHP_EOL; // 输出: this is string

标点符号处理: 当前的 explode(‘ ‘, …) 方法仅仅以空格作为分隔符。如果字符串中包含逗号、句号、问号等标点符号,它们将与单词一起被视为一个整体(例如 “string.” 会与 “string” 不同)。对于更复杂的文本处理,建议使用 preg_split() 结合正则表达式来更精确地分词,去除标点符号并处理多种分隔符。

function getCleanWords(string $text): array{    // 使用正则表达式匹配非字母数字字符作为分隔符,并去除空字符串    return array_filter(preg_split('/[^a-zA-Z0-9]+/', $text, -1, PREG_SPLIT_NO_EMPTY));}function getCommonWordsAdvanced(string $string1, string $string2): string{    $words1 = array_map('strtolower', getCleanWords($string1));    $words2 = array_map('strtolower', getCleanWords($string2));    $commonWordsArray = array_intersect($words1, $words2);    return implode(' ', array_unique($commonWordsArray)); // array_unique确保输出的单词不重复}$text_advanced1 = "Hello, world! This is a test string.";$text_advanced2 = "World, this is another test.";echo "高级共同单词: " . getCommonWordsAdvanced($text_advanced1, $text_advanced2) . PHP_EOL; // 输出: world this is a test

性能考量: 对于大多数常见应用场景,explode() 和 array_intersect() 的组合已经足够高效。PHP的内置函数通常由C语言实现,性能经过高度优化。对于处理非常巨大的文本文件或极长的字符串,可以考虑分块处理或使用专门的文本处理库。

总结

通过利用PHP的 explode()、array_intersect() 和 implode() 函数,我们可以非常高效且简洁地实现两个字符串之间公共单词的提取。这种方法不仅代码量少,而且性能优越,是处理此类字符串匹配问题的推荐实践。在实际应用中,根据具体需求(如是否需要大小写不敏感、如何处理标点符号等),可以对上述基础函数进行适当的扩展和优化,以满足更复杂的文本分析场景。

以上就是PHP高效提取两个字符串中的公共单词的详细内容,更多请关注php中文网其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1341868.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月13日 05:04:54
下一篇 2025年12月13日 05:05:09

相关推荐

  • 如何直接访问 Sass 地图变量的值?

    直接访问 sass 地图变量的值 在 sass 中,我们可以使用地图变量来存储一组键值对。而有时候,我们可能需要直接访问其中的某个值。 可以通过 map-get 函数直接从地图中获取特定的值。语法如下: map-get($map, $key) 其中: $map 是我们要获取值的 sass 地图变量。…

    2025年12月24日
    000
  • 什么是功能类优先的 CSS 框架?

    理解功能类优先 tailwind css 是一款功能类优先的 css 框架,用户可以通过组合功能类轻松构建设计。为了理解功能类优先,我们首先要区分语义类和功能类这两种 css 类名命名方式。 语义类 以前比较常见的 css 命名方式是根据页面中模块的功能来命名。例如: 立即学习“前端免费学习笔记(深…

    2025年12月24日
    000
  • SCSS – 增强您的 CSS 工作流程

    在本文中,我们将探索 scss (sassy css),这是一个 css 预处理器,它通过允许变量、嵌套规则、mixins、函数等来扩展 css 的功能。 scss 使 css 的编写和维护变得更加容易,尤其是对于大型项目。 1.什么是scss? scss 是 sass(syntropically …

    2025年12月24日
    000
  • 我如何编写 CSS 选择器

    CSS 方法有很多,但我都讨厌它们。有些多(顺风等),有些少(BEM、OOCSS 等)。但归根结底,它们都有缺陷。 当然,人们使用这些方法有充分的理由,并且解决的许多问题我也遇到过。因此,在这篇文章中,我想写下我自己的关于如何保持 CSS 井井有条的指南。 这并不是一个任何人都可以开始使用的完整描述…

    2025年12月24日
    000
  • css3选择器优化技巧

    CSS3 选择器优化技巧可提升网页性能:减少选择器层级,提高浏览器解析效率。避免通配符选择器,减少性能损耗。优先使用 ID 选择器,快速定位目标元素。用类选择器代替标签选择器,精确匹配。使用属性选择器,增强匹配精度。巧用伪类和伪元素,提升性能。组合多个选择器,简化代码。利用 CSS 预处理器,增强代…

    2025年12月24日
    300
  • css代码规范有哪些

    CSS 代码规范对于保持一致性、可读性和可维护性至关重要,常见的规范包括:命名约定:使用小写字母和短划线,命名特定且描述性。缩进和对齐:按特定规则缩进、对齐选择器、声明和值。属性和值顺序:遵循特定顺序排列属性和值。注释:解释复杂代码,并使用正确的语法。分号:每个声明后添加分号。大括号:左大括号前换行…

    2025年12月24日
    200
  • 网页设计css样式代码大全,快来收藏吧!

    减少很多不必要的代码,html+css可以很方便的进行网页的排版布局。小伙伴们收藏好哦~ 一.文本设置    1、font-size: 字号参数  2、font-style: 字体格式 3、font-weight: 字体粗细 4、颜色属性 立即学习“前端免费学习笔记(深入)”; color: 参数 …

    2025年12月24日
    000
  • css中id选择器和class选择器有何不同

    之前的文章《什么是CSS语法?详细介绍使用方法及规则》中带了解CSS语法使用方法及规则。下面本篇文章来带大家了解一下CSS中的id选择器与class选择器,介绍一下它们的区别,快来一起学习吧!! id选择器和class选择器介绍 CSS中对html元素的样式进行控制是通过CSS选择器来完成的,最常用…

    2025年12月24日
    000
  • php约瑟夫问题如何解决

    “约瑟夫环”是一个数学的应用问题:一群猴子排成一圈,按1,2,…,n依次编号。然后从第1只开始数,数到第m只,把它踢出圈,从它后面再开始数, 再数到第m只,在把它踢出去…,如此不停的进行下去, 直到最后只剩下一只猴子为止,那只猴子就叫做大王。要求编程模拟此过程,输入m、n, 输出最后那个大王的编号。…

    好文分享 2025年12月24日
    000
  • CSS的Word中的列表详解

    在word中,列表也是使用频率非常高的元素。在css中,列表和列表项都是块级元素。也就是说,一个列表会形成一个块框,其中的每个列表项也会形成一个独立的块框。所以,盒模型中块框的所有属性,都适用于列表和列表项。 除此之外,列表还有 3 个特有的属性 list-style-type、list-style…

    2025年12月24日
    000
  • CSS新手整理的有关CSS使用技巧

    [导读]  1、不要使用过小的图片做背景平铺。这就是为何很多人都不用 1px 的原因,这才知晓。宽高 1px 的图片平铺出一个宽高 200px 的区域,需要 200*200=40, 000 次,占用资源。  2、无边框。推荐的写法是     1、不要使用过小的图片做背景平铺。这就是为何很多人都不用 …

    好文分享 2025年12月23日
    000
  • CSS中实现图片垂直居中方法详解

    [导读] 在曾经的 淘宝ued 招聘 中有这样一道题目:“使用纯css实现未知尺寸的图片(但高宽都小于200px)在200px的正方形容器中水平和垂直居中。”当然出题并不是随意,而是有其现实的原因,垂直居中是 淘宝 工作中最 在曾经的 淘宝UED 招聘 中有这样一道题目: “使用纯CSS实现未知尺寸…

    好文分享 2025年12月23日
    000
  • CSS派生选择器

    [导读] 派生选择器通过依据元素在其位置的上下文关系来定义样式,你可以使标记更加简洁。在 css1 中,通过这种方式来应用规则的选择器被称为上下文选择器 (contextual selectors),这是由于它们依赖于上下文关系来应 派生选择器 通过依据元素在其位置的上下文关系来定义样式,你可以使标…

    好文分享 2025年12月23日
    000
  • CSS 基础语法

    [导读] css 语法 css 规则由两个主要的部分构成:选择器,以及一条或多条声明。selector {declaration1; declaration2;     declarationn }选择器通常是您需要改变样式的 html 元素。每条声明由一个属性和一个 CSS 语法 CSS 规则由两…

    2025年12月23日
    300
  • CSS 高级语法

    [导读] 选择器的分组你可以对选择器进行分组,这样,被分组的选择器就可以分享相同的声明。用逗号将需要分组的选择器分开。在下面的例子中,我们对所有的标题元素进行了分组。所有的标题元素都是绿色的。h1,h2,h3,h4,h5 选择器的分组 你可以对选择器进行分组,这样,被分组的选择器就可以分享相同的声明…

    好文分享 2025年12月23日
    000
  • CSS id 选择器

    [导读] id 选择器id 选择器可以为标有特定 id 的 html 元素指定特定的样式。id 选择器以 ” ” 来定义。下面的两个 id 选择器,第一个可以定义元素的颜色为红色,第二个定义元素的颜色为绿色: red {color:re id 选择器 id 选择器可以为标有特…

    好文分享 2025年12月23日
    000
  • 有关css的绝对定位

    [导读] 定位(左边和顶部) css定位属性将是网虫们打开幸福之门的钥匙: h4 { position: absolute; left: 100px; top: 43px }这项css规则让浏览器将 的起始位置精 确地定在距离浏览器左边100象素,距离其 定位(左边和顶部) css定位属性将是网虫们…

    好文分享 2025年12月23日
    000
  • html5能否禁用搜索框自动填充_html5autocomplete关闭方法【教程】

    禁用HTML5搜索框自动填充有五种方法:一、设autocomplete=”off”;二、随机化name/id值;三、用无效autocomplete值如”nope”;四、JS动态设置autocomplete;五、设autocomplete=”…

    2025年12月23日
    000
  • html5怎么加php_html5用Ajax与PHP后端交互实现数据传递【交互】

    HTML5不能直接运行PHP,需通过Ajax与PHP通信:前端用fetch发送请求,PHP接收处理并返回JSON,前端解析响应更新DOM;注意跨域、编码、CSRF防护和输入过滤。 HTML5 本身是前端标记语言,不能直接运行 PHP 代码,但可以通过 Ajax(异步 JavaScript)与 PHP…

    2025年12月23日
    300
  • html5 js怎么加_html5用script标签内嵌或外链引入JS代码【添加】

    在HTML5中执行JavaScript需通过script标签:一、内联编写于head或body中;二、外链引入.js文件并建议放body末尾或加defer;三、defer按序执行,async独立执行;四、可动态创建script元素插入执行。 如果您希望在HTML5页面中执行JavaScript代码,…

    2025年12月23日
    000

发表回复

登录后才能评论
关注微信