掌握JavaScript正则高级技巧可提升文本处理效率:1. 分组捕获与反向引用(如/(w+)s+/)提取重复词;2. 零宽断言((?=…)和(?

JavaScript中的正则表达式除了基础的匹配、替换和测试外,掌握一些高级技巧能大幅提升处理文本的效率和准确性。以下是几个实用且强大的高级匹配方法。
1. 分组捕获与反向引用
使用括号 () 可以创建捕获分组,提取匹配中的特定部分。在正则内部可通过 , 等进行反向引用,匹配之前分组的内容。
例如:匹配重复单词
/(w+)s+/g 可以匹配像 “hello hello” 这样的重复词,其中 引用第一个分组的结果。
实际应用:
const text = “The the quick brown fox fox jumps”; console.log(text.replace(/(w+)s+/gi, “$1″)); // 输出:”The quick brown fox jumps”
2. 零宽断言(Lookahead 和 Lookbehind)
零宽断言用于指定某个位置前后必须满足某种条件,但不包含这些字符在匹配结果中。
立即学习“Java免费学习笔记(深入)”;
正向先行断言 (?=…):
匹配后面紧跟特定内容的位置。
/Java(?=Script)/ 匹配 “Java” 仅当其后是 “Script”,如 “JavaScript” 中的 “Java”。
负向先行断言 (?!…):
/Java(?!Script)/ 匹配 “Java” 后面不是 “Script” 的情况,比如 “Java is great” 中的 “Java”。
正向后行断言 (?(ES2018 支持):
匹配前面有美元符号的数字,如 "0" 中的 "100"。负向后行断言 (?<!...):
[置顶]Android中的JSON详细总结 中文WORD版查看详情JSON(JavaScript Object Notation) 定义:一种轻量级的数据交换格式,具有良好的可读和便于快速编写的特性。业内主流技术为其提供了完整的解决方案(有点类似于正则表达式,获得了当今大部分语言的支持),从而可以在不同平台间进行数据交换。JSON采用兼容性很高的文本格式,同时也具备类似于C语言体系的行为。有需要的朋友可以下载看看
0
![]()
<code/(?<!$)d+/
匹配前面没有 “$” 的数字,避免匹配价格。
3. 惰性匹配与贪婪匹配控制
默认情况下,量词如 *、+ 是贪婪的,尽可能多地匹配。加上 ? 变为惰性匹配。
例子:
从字符串 "
" 中提取每个 div 内容。
贪婪匹配:/
惰性匹配:/
4. 使用修饰符提升灵活性
正则表达式支持多个修饰符,组合使用可增强功能。
- g:全局匹配,找到所有结果
- i:忽略大小写
- m:多行模式,^ 和 $ 匹配每行起止
- s:dotAll 模式,让 . 匹配换行符(ES2018)
- u:启用 Unicode 正确支持,处理 emoji 或特殊字符
示例:匹配多行注释(含换行)
//*[sS]*?*//gs 利用 [sS] 或开启 s 修饰符来跨行匹配。
现代写法://*.*?*//gs 在支持 s 的环境中更清晰。
5. 动态构建正则表达式
使用 RegExp 构造函数可以动态插入变量,适合搜索高亮、关键词过滤等场景。
例子:高亮搜索词
function highlight(text, word) { const escaped = word.replace(/[.*+?^${}()|[]]/g, '$&'); const regex = new RegExp(`(${escaped})`, 'gi'); return text.replace(regex, '$1'); }
注意对用户输入进行转义,防止正则注入。
基本上就这些。灵活运用分组、断言、修饰符和动态构造,能让正则在复杂文本处理中游刃有余。关键是理解匹配机制,避免过度依赖正则处理结构化数据(如 HTML 解析)。
以上就是JavaScript中的正则表达式有哪些高级匹配技巧?的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1527004.html
微信扫一扫
支付宝扫一扫