使用 Java 正则表达式和 Stream API 对字符串中的单词进行数字排序

使用 java 正则表达式和 stream api 对字符串中的单词进行数字排序

本文详细介绍了如何使用 Java 语言,结合正则表达式(Lookaround)和 Stream API,对包含数字的字符串进行单词排序。通过将单词与对应的数字关联,并利用Map进行存储,最终实现按数字顺序重组字符串,解决字符串乱序问题。

问题描述

在日常编程中,我们有时会遇到需要根据字符串中内嵌的数字来重新排列单词的需求。例如,给定字符串 “my1kiran4name2is3″,其中每个单词后面都跟着一个数字(1-9),表示该单词在最终序列中的位置。我们的目标是根据这些数字,将单词重新排列为 “my name is kiran”。

示例:

my 对应数字 1kiran 对应数字 4name 对应数字 2is 对应数字 3

按数字顺序排列后,结果应为:my (1) name (2) is (3) kiran (4)。

解决方案:基于正则表达式与 Stream API

解决此问题的一种高效方法是结合使用 Java 的正则表达式(特别是零宽断言)和 Stream API。这种方法能够优雅地将单词与数字分离,并进行后续处理。

立即学习“Java免费学习笔记(深入)”;

核心思路

初始分割: 将整个字符串分割成“单词+数字”的片段(例如:”my1″, “kiran4″)。二次分割与映射: 对每个片段,进一步将其分割为独立的单词和数字,并构建一个映射(Map),其中数字作为键,单词作为值。排序与重组: 根据数字键的顺序,从映射中提取单词,并用空格连接起来形成最终的字符串。

步骤详解

我们将以字符串 “my1kiran4name2is3” 为例,逐步解释代码逻辑。

1. 初始分割:利用正向后行断言 ((?<=d))

第一步是将原始字符串根据数字进行分割,但要保留数字作为每个片段的结尾。这里使用正则表达式 (?<=d),它是一个正向后行断言(Positive Lookbehind)。这意味着它会匹配紧跟在一个数字 (d) 后面的位置,但不会将数字本身包含在匹配结果中。

String string = "my1kiran4name2is3";// string.split("(?<=d)") 的结果是:["my1", "kiran4", "name2", "is3"]

经过这一步,我们得到了一个包含“单词+数字”形式的字符串列表。

2. 二次分割与映射:利用正向先行断言 ((?=d)) 并构建 Map

接下来,对上一步得到的每个片段(如 “my1″),我们需要将其进一步分割成单词和数字。这里使用 s.split(“(?=d)”),(?=d) 是一个正向先行断言(Positive Lookahead)。它会匹配紧跟在一个数字 (d) 前面的位置,但同样不将数字本身包含在匹配结果中。这使得数字成为分割后的第二个元素。

// 以 "my1" 为例,s.split("(?=d)") 的结果是:["my", "1"]// 以 "kiran4" 为例,s.split("(?=d)") 的结果是:["kiran", "4"]

然后,我们使用 Stream API 的 collect(Collectors.toMap(…)) 方法将这些分割后的数组转换为一个 Map。数字字符串被解析为 Integer 作为键,单词作为值。

Map map = Arrays.asList(string.split("(? s.split("(?=d)"))                       // 对每个元素进行二次分割        .collect(Collectors.toMap(e -> Integer.parseInt(e[1]), e -> e[0]));// 最终得到的 map 可能是:{1="my", 4="kiran", 2="name", 3="is"}// 注意:HashMap 的迭代顺序不确定,下文会详细说明。

3. 重组字符串:连接 Map 中的值

最后一步是从 map 中提取单词并用空格连接。原始解决方案直接使用了 map.values().stream().collect(Collectors.joining(” “))。

string = map.values().stream()        .collect((Collectors.joining(" ")));// 假设 map.values() 按键的顺序迭代,则结果为 "my name is kiran"

完整示例代码

import java.util.Arrays;import java.util.Map;import java.util.stream.Collectors;import java.util.TreeMap; // 导入 TreeMap 以确保排序public class StringSorter {    public static void main(String[] args) {        String inputString = "my1kiran4name2is3";        System.out.println("原始字符串: " + inputString);        // 步骤1 & 2: 分割并构建 Map        Map wordMap =                Arrays.asList(inputString                        .split("(? s.split("(?=d)")) // 第二次分割:[["my", "1"], ["kiran", "4"], ...]                        // 使用 TreeMap::new 确保 Map 内部按键排序                        .collect(Collectors.toMap(                                e -> Integer.parseInt(e[1]), // 键:数字                                e -> e[0],                   // 值:单词                                (oldValue, newValue) -> oldValue, // 处理重复键(此处不应发生)                                TreeMap::new                 // 指定使用 TreeMap                        ));        // 步骤3: 从 Map 中按键顺序提取值并连接        String sortedString = wordMap                .values() // TreeMap 的 values() 方法会按键的自然顺序迭代                .stream()                .collect(Collectors.joining(" "));        System.out.println("排序后的字符串: " + sortedString);    }}

输出:

原始字符串: my1kiran4name2is3排序后的字符串: my name is kiran

注意事项

代码可读性与维护性:虽然上述解决方案利用了正则表达式和 Stream API 的强大功能,但其简洁性有时会牺牲一定的可读性,特别是对于不熟悉正则表达式零宽断言的开发者。在实际项目中,如果团队成员对这些高级特性不熟悉,可能需要添加详细注释或考虑更直观(尽管可能更冗长)的实现方式。

Map 的排序问题:原始的 Collectors.toMap 默认创建的是 HashMap。HashMap 不保证元素的迭代顺序,这意味着 map.values().stream() 所产生的单词顺序可能不是按数字从小到大排列的。为了确保最终输出的单词严格按照数字顺序排列,应采取以下两种策略之一:

指定使用 TreeMap: 在 collect 阶段指定使用 TreeMap,如示例代码所示。TreeMap 会自动根据键的自然顺序(对于 Integer 来说就是数值大小)进行排序。collect(Collectors.toMap(keyMapper, valueMapper, mergeFunction, TreeMap::new))对 Map.Entry 进行排序: 如果必须使用 HashMap 或其他不保证顺序的 Map 实现,可以在获取值之前对 Map.Entry 进行排序:map.entrySet().stream().sorted(Map.Entry.comparingByKey()).map(Map.Entry::getValue).collect(Collectors.joining(” “));本文提供的示例代码已采用第一种方法,通过指定 TreeMap::new 来保证最终输出的正确排序。

数字范围与格式:本解决方案假设数字为单个数字(1-9)。如果字符串中的数字可能是多位数(例如 “word10″),则正则表达式 d 需要修改为 d+(匹配一个或多个数字),并且相应的 split 逻辑需要确保正确处理多位数字。例如,”word10” 使用 s.split(“(?=d)”) 仍会得到 [“word”, “10”],所以对于多位数是兼容的。但如果数字前或后有其他字符,则需要更复杂的正则匹配。

总结

本教程详细展示了如何利用 Java 的正则表达式(特别是正向先行和后行断言)和 Stream API 来解决根据内嵌数字对字符串中单词进行排序的问题。通过将复杂的字符串处理分解为逻辑清晰的步骤:分割、映射和重组,并注意 Map 的排序特性,我们可以构建出既高效又准确的解决方案。在实际应用中,除了关注功能的实现,代码的可读性和健壮性(如处理不同数字范围和确保排序)同样至关重要。

以上就是使用 Java 正则表达式和 Stream API 对字符串中的单词进行数字排序的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/102061.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月21日 07:01:11
下一篇 2025年11月21日 07:54:09

相关推荐

  • Word2013如何插入SmartArt图形_Word2013SmartArt插入的视觉表达

    答案:可通过四种方法在Word 2013中插入SmartArt图形。一、使用“插入”选项卡中的“SmartArt”按钮,选择所需类型并插入;二、从快速样式库中选择常用模板如组织结构图直接应用;三、复制已有SmartArt图形到目标文档后调整内容与格式;四、将带项目符号的文本选中后右键转换为Smart…

    2025年12月6日 软件教程
    000
  • 怎样用免费工具美化PPT_免费美化PPT的实用方法分享

    利用KIMI智能助手可免费将PPT美化为科技感风格,但需核对文字准确性;2. 天工AI擅长优化内容结构,提升逻辑性,适合高质量内容需求;3. SlidesAI支持语音输入与自动排版,操作便捷,利于紧急场景;4. Prezo提供多种模板,自动生成图文并茂幻灯片,适合学生与初创团队。 如果您有一份内容完…

    2025年12月6日 软件教程
    000
  • Pages怎么协作编辑同一文档 Pages多人实时协作的流程

    首先启用Pages共享功能,点击右上角共享按钮并选择“添加协作者”,设置为可编辑并生成链接;接着复制链接通过邮件或社交软件发送给成员,确保其使用Apple ID登录iCloud后即可加入编辑;也可直接在共享菜单中输入邮箱地址定向邀请,设定编辑权限后发送;最后在共享面板中管理协作者权限,查看实时在线状…

    2025年12月6日 软件教程
    100
  • word表格怎么调整行高_word表格行高调整的具体操作

    手动拖动可快速调整单行行高;2. 通过表格属性精确设置指定高度,选择固定值或最小值模式;3. 全选表格批量统一行高;4. 设为自动或最小值使行高随内容自适应,确保文字显示完整。 在使用Word制作表格时,调整行高是常见的排版需求。合理的行高能让表格内容更清晰易读。下面介绍几种常用的调整Word表格行…

    2025年12月6日 软件教程
    000
  • REDMI K90系列正式发布,售价2599元起!

    10月23日,redmi k90系列正式亮相,推出redmi k90与redmi k90 pro max两款新机。其中,redmi k90搭载骁龙8至尊版处理器、7100mah大电池及100w有线快充等多项旗舰配置,起售价为2599元,官方称其为k系列迄今为止最完整的标准版本。 图源:REDMI红米…

    2025年12月6日 行业动态
    200
  • Linux中如何安装Nginx服务_Linux安装Nginx服务的完整指南

    首先更新系统软件包,然后通过对应包管理器安装Nginx,启动并启用服务,开放防火墙端口,最后验证欢迎页显示以确认安装成功。 在Linux系统中安装Nginx服务是搭建Web服务器的第一步。Nginx以高性能、低资源消耗和良好的并发处理能力著称,广泛用于静态内容服务、反向代理和负载均衡。以下是在主流L…

    2025年12月6日 运维
    000
  • Linux journalctl与systemctl status结合分析

    先看 systemctl status 确认服务状态,再用 journalctl 查看详细日志。例如 nginx 启动失败时,systemctl status 显示 Active: failed,journalctl -u nginx 发现端口 80 被占用,结合两者可快速定位问题根源。 在 Lin…

    2025年12月6日 运维
    100
  • 华为新机发布计划曝光:Pura 90系列或明年4月登场

    近日,有数码博主透露了华为2025年至2026年的新品规划,其中pura 90系列预计在2026年4月发布,有望成为华为新一代影像旗舰。根据路线图,华为将在2025年底至2026年陆续推出mate 80系列、折叠屏新机mate x7系列以及nova 15系列,而pura 90系列则将成为2026年上…

    2025年12月6日 行业动态
    100
  • Linux如何优化系统性能_Linux系统性能优化的实用方法

    优化Linux性能需先监控资源使用,通过top、vmstat等命令分析负载,再调整内核参数如TCP优化与内存交换,结合关闭无用服务、选用合适文件系统与I/O调度器,持续按需调优以提升系统效率。 Linux系统性能优化的核心在于合理配置资源、监控系统状态并及时调整瓶颈环节。通过一系列实用手段,可以显著…

    2025年12月6日 运维
    000
  • Pboot插件数据库连接的配置教程_Pboot插件数据库备份的自动化脚本

    首先配置PbootCMS数据库连接参数,确保插件正常访问;接着创建auto_backup.php脚本实现备份功能;然后通过Windows任务计划程序或Linux Cron定时执行该脚本,完成自动化备份流程。 如果您正在开发或维护一个基于PbootCMS的网站,并希望实现插件对数据库的连接配置以及自动…

    2025年12月6日 软件教程
    000
  • Linux命令行中wc命令的实用技巧

    wc命令可统计文件的行数、单词数、字符数和字节数,常用-l统计行数,如wc -l /etc/passwd查看用户数量;结合grep可分析日志,如grep “error” logfile.txt | wc -l统计错误行数;-w统计单词数,-m统计字符数(含空格换行),-c统计…

    2025年12月6日 运维
    000
  • 曝小米17 Air正在筹备 超薄机身+2亿像素+eSIM技术?

    近日,手机行业再度掀起超薄机型热潮,三星与苹果已相继推出s25 edge与iphone air等轻薄旗舰,引发市场高度关注。在此趋势下,多家国产厂商被曝正积极布局相关技术,加速抢占这一细分赛道。据业内人士消息,小米的超薄旗舰机型小米17 air已进入筹备阶段。 小米17 Pro 爆料显示,小米正在评…

    2025年12月6日 行业动态
    000
  • 荣耀手表5Pro 10月23日正式开启首销国补优惠价1359.2元起售

    荣耀手表5pro自9月25日开启全渠道预售以来,市场热度持续攀升,上市初期便迎来抢购热潮,一度出现全线售罄、供不应求的局面。10月23日,荣耀手表5pro正式迎来首销,提供蓝牙版与esim版两种选择。其中,蓝牙版本的攀登者(橙色)、开拓者(黑色)和远航者(灰色)首销期间享受国补优惠价,到手价为135…

    2025年12月6日 行业动态
    000
  • Vue.js应用中配置环境变量:灵活管理后端通信地址

    在%ignore_a_1%应用中,灵活配置后端api地址等参数是开发与部署的关键。本文将详细介绍两种主要的环境变量配置方法:推荐使用的`.env`文件,以及通过`cross-env`库在命令行中设置环境变量。通过这些方法,开发者可以轻松实现开发、测试、生产等不同环境下配置的动态切换,提高应用的可维护…

    2025年12月6日 web前端
    000
  • VSCode选择范围提供者实现

    Selection Range Provider是VSCode中用于实现层级化代码选择的API,通过注册provideSelectionRanges方法,按光标位置从内到外逐层扩展选择范围,如从变量名扩展至函数体;需结合AST解析构建准确的SelectionRange链式结构以提升选择智能性。 在 …

    2025年12月6日 开发工具
    000
  • JavaScript动态生成日历式水平日期布局的优化实践

    本教程将指导如何使用javascript高效、正确地动态生成html表格中的日历式水平日期布局。重点解决直接操作`innerhtml`时遇到的标签闭合问题,通过数组构建html字符串来避免浏览器解析错误,并利用事件委托机制优化动态生成元素的事件处理,确保生成结构清晰、功能完善的日期展示。 在前端开发…

    2025年12月6日 web前端
    000
  • JavaScript响应式编程与Observable

    Observable是响应式编程中处理异步数据流的核心概念,它允许随时间推移发出多个值,支持订阅、操作符链式调用及统一错误处理,广泛应用于事件监听、状态管理和复杂异步逻辑,提升代码可维护性与可读性。 响应式编程是一种面向数据流和变化传播的编程范式。在前端开发中,尤其面对复杂的用户交互和异步操作时,J…

    2025年12月6日 web前端
    000
  • JavaScript生成器与迭代器协议实现

    生成器和迭代器基于统一协议实现惰性求值与数据遍历,通过next()方法返回{value, done}对象,生成器函数简化了迭代器创建过程,提升处理大数据序列的效率与代码可读性。 JavaScript中的生成器(Generator)和迭代器(Iterator)是处理数据序列的重要机制,尤其在处理惰性求…

    2025年12月6日 web前端
    000
  • 环境搭建docker环境下如何快速部署mysql集群

    使用Docker Compose部署MySQL主从集群,通过配置文件设置server-id和binlog,编写docker-compose.yml定义主从服务并组网,启动后创建复制用户并配置主从连接,最后验证数据同步是否正常。 在Docker环境下快速部署MySQL集群,关键在于合理使用Docker…

    2025年12月6日 数据库
    000
  • Xbox删忍龙美女角色 斯宾塞致敬板垣伴信被喷太虚伪

    近日,海外游戏推主@HaileyEira公开发表言论,批评Xbox负责人菲尔·斯宾塞不配向已故的《死或生》与《忍者龙剑传》系列之父板垣伴信致敬。她指出,Xbox并未真正尊重这位传奇制作人的创作遗产,反而在宣传相关作品时对内容进行了审查和删减。 所涉游戏为年初推出的《忍者龙剑传2:黑之章》,该作采用虚…

    2025年12月6日 游戏教程
    000

发表回复

登录后才能评论
关注微信