python如何分割字符串_python字符串分割split函数使用详解

程序猿 • 2025年12月14日 11:42:15 • 用户投稿 • 阅读 0

Python字符串分割时，最核心方法是split()。默认sep=None会按任意空白字符分割并自动过滤空字符串和首尾空白；指定sep时需注意可能产生空字符串；maxsplit可限制分割次数。处理空白和空字符串推荐用split()无参形式或结合strip()与列表推导式过滤。其他方法包括rsplit()（从右分割）、partition()/rpartition()（返回三元组）、re.split()（正则分割）和splitlines()（按行分割），应根据场景选择合适方法，避免常见陷阱如误用空字符串作分隔符或忽略连续分隔符导致的空元素。

Python中分割字符串，最核心且常用的工具无疑是内置的

split()

方法。它能根据你指定的或默认的分隔符，将一个字符串切分成一个子字符串的列表。这个函数用起来直观又灵活，无论是处理简单的文本数据，还是解析配置文件中的行，它都是你首先会想到的那把“瑞士军刀”。

解决方案

str.split(sep=None, maxsplit=-1)

是Python字符串对象自带的一个方法，用于将字符串按照指定的分隔符进行切分，并返回一个包含切分后子字符串的列表。理解它的两个参数至关重要：

sep

(separator，分隔符): 这是一个可选参数，用于指定字符串中用来进行分割的字符或字符串。

当

sep

为

None

(默认值) 时：

split()

会根据任意空白字符（空格、制表符

、换行符

等）进行分割。更妙的是，它会自动忽略开头和结尾的空白字符，并且将多个连续的空白字符视为一个分隔符。这在处理用户输入或不规则文本时简直是神来之笔，省去了很多预处理的麻烦。当

sep

为一个具体的字符串时：

split()

会严格按照这个字符串进行分割。如果分隔符出现在字符串的开头或结尾，或者连续出现，那么结果列表中可能会包含空字符串。这是新手常会踩的坑，需要特别留意。注意：

sep

不能是一个空字符串

''

，那样会抛出

ValueError

。

maxsplit

(最大分割次数): 这也是一个可选参数，用于指定最大分割次数。

立即学习“Python免费学习笔记（深入）”；

当

maxsplit

为

-1

(默认值) 时： 表示不限制分割次数，会尽可能地进行所有可能的分割。当

maxsplit

为一个非负整数

n

时：字符串最多只会被分割

次。这意味着结果列表中最多会有

n + 1

个元素。这个参数在解析结构化数据，比如CSV行，或者日志文件时，如果你只关心前几部分，而剩下的部分想作为一个整体保留时，会非常有用。

无论哪种情况，

split()

方法的返回值都是一个字符串列表。

让我们看几个例子，感受一下它的威力：

# 1. 默认分隔符 (None) - 处理空白字符的优雅方式text1 = "  Hello   World t Python  "parts1 = text1.split()print(f"默认分割: {parts1}") # 输出: ['Hello', 'World', 'Python']# 2. 指定分隔符data_str = "apple,banana,cherry,grape"fruits = data_str.split(',')print(f"逗号分割: {fruits}") # 输出: ['apple', 'banana', 'cherry', 'grape']# 3. 指定分隔符，但分隔符在开头/结尾或连续path_str = "/usr/local//bin/"path_parts = path_str.split('/')print(f"路径分割: {path_parts}") # 输出: ['', 'usr', 'local', '', 'bin', ''] - 注意空字符串# 4. 使用 maxsplitlog_entry = "INFO:2023-10-27:User logged in from 192.168.1.1"first_two_parts = log_entry.split(':', maxsplit=2)print(f"限制分割: {first_two_parts}") # 输出: ['INFO', '2023-10-27', 'User logged in from 192.168.1.1']# 5. 分割一个没有分隔符的字符串single_word = "Python"result_no_sep = single_word.split('-')print(f"无分隔符: {result_no_sep}") # 输出: ['Python'] - 返回包含原字符串的单元素列表

Python字符串分割时如何处理空白字符和空字符串？

这绝对是初学者，甚至是一些有经验的开发者都会感到困惑的地方。当你用

split()

分割字符串时，结果列表中出现意料之外的空字符串或者多余的空白字符，是常有的事。但Python提供了相当优雅的解决方案，关键在于理解

sep=None

的魔力以及一些后处理技巧。

首先，我个人最喜欢，也是最推荐的方式，就是利用

split()

的默认行为，也就是当

sep

参数为

None

时。正如前面提到的，

str.split()

（不带任何参数）会自动处理所有空白字符（空格、制表符、换行符等），将它们视为单个分隔符，并且会聪明地丢弃结果中的空字符串。这意味着，如果你有一个像

"  Hello   World  "

这样的字符串，直接

"  Hello   World  ".split()

就会给你

['Hello', 'World']

，干净利落，省心省力。在我处理用户输入或者从文件读取的不规则文本时，这几乎是我的首选。

然而，如果你指定了特定的分隔符，比如

data = "apple,,banana".split(',')

，结果就会是

['apple', '', 'banana']

。这里的空字符串

''

是因为两个逗号之间没有任何内容。同样，

"/home//user/".split('/')

会产生

['', 'home', '', 'user', '']

。在这种情况下，仅仅依靠

split()

本身就不够了。

解决这些问题的几种常见策略：

利用

sep=None

的优势： 如果你的分隔符本质上就是空白字符，或者你可以将非空白分隔符替换成空白字符再进行分割，那么直接使用

str.split()

（无参数）是最高效和简洁的方法。

# 示例：将逗号替换为空格再默认分割data_with_commas_and_spaces = "apple,  banana, , cherry".replace(',', ' ')cleaned_parts = data_with_commas_and_spaces.split()print(f"替换后默认分割: {cleaned_parts}") # 输出: ['apple', 'banana', 'cherry']

strip()

预处理： 如果你字符串的开头或结尾有不想要的空白字符，而你又需要指定特定的分隔符，那么在

split()

之前先用

strip()

方法去除首尾空白是个好习惯。

line = "  item1, item2 , item3  "cleaned_line = line.strip() # "item1, item2 , item3"parts = cleaned_line.split(',')print(f"strip后分割: {parts}") # 输出: ['item1', ' item2 ', ' item3']# 注意：中间的空格还需要进一步处理，比如列表推导式

列表推导式过滤： 当你使用特定分隔符导致结果中出现空字符串时，最直接的办法就是用列表推导式（List Comprehension）来过滤掉它们。

path_str = "/usr/local//bin/"raw_parts = path_str.split('/')filtered_parts = [part for part in raw_parts if part] # 过滤掉所有空字符串print(f"过滤空字符串: {filtered_parts}") # 输出: ['usr', 'local', 'bin']# 结合strip()和过滤空字符串，并对每个元素进行strip()line = "  item1, item2 , item3  "parts_processed = [p.strip() for p in line.strip().split(',') if p.strip()]print(f"全面处理: {parts_processed}") # 输出: ['item1', 'item2', 'item3']

这种组合拳在处理CSV文件或者其他结构化文本时非常常见，它能确保你得到一个干净、无冗余的元素列表。

除了split()，Python还有哪些字符串分割的替代方法或高级技巧？

split()

无疑是主力，但Python的字符串处理能力远不止于此。在面对更复杂的分割需求时，我们还有其他几位得力的助手。我通常会根据具体场景来选择最合适的工具，而不是一味地只用

split()

。

str.rsplit(sep=None, maxsplit=-1)

：从右侧开始分割

rsplit()

和

split()

的参数和行为几乎一样，唯一的区别在于它从字符串的右侧开始进行分割。这在处理文件路径（比如只想要文件扩展名），或者某些数据格式（比如日志信息中，最后一部分是变长的消息体）时特别有用。

filename = "archive.tar.gz"name_parts = filename.rsplit('.', 1) # 只从右边分割一次print(f"rsplit文件名: {name_parts}") # 输出: ['archive.tar', 'gz']# 对比 split()name_parts_split = filename.split('.', 1)print(f"split文件名: {name_parts_split}") # 输出: ['archive', 'tar.gz']

你看，根据你想要的结果是文件名和扩展名（

rsplit

）还是第一部分和剩余部分（

split

），选择就变得清晰了。

str.partition(sep)

和

str.rpartition(sep)

：分割成三元组这两个方法的设计理念和

split()

完全不同。它们只分割一次，并且会返回一个包含三部分的元组：

(分隔符之前的部分, 分隔符本身, 分隔符之后的部分)

。如果找不到分隔符，

partition()

会返回

(原字符串, '', '')

。

partition()

从左边找第一个分隔符，

rpartition()

从右边找第一个分隔符。我发现它们在需要明确保留分隔符，或者只需要将字符串逻辑上分成三段时非常方便，比

find()

和切片操作更简洁、更安全。

full_name = "John Doe"first, sep, last = full_name.partition(' ')print(f"partition姓名: First='{first}', Sep='{sep}', Last='{last}'") # 输出: First='John', Sep=' ', Last='Doe'url = "https://www.example.com/path/to/resource"protocol, sep, rest = url.partition('://')print(f"partition协议: Protocol='{protocol}', Sep='{sep}', Rest='{rest}'") # 输出: Protocol='https', Sep='://', Rest='www.example.com/path/to/resource'# rpartition 查找最后一个斜杠file_path = "/home/user/documents/report.pdf"directory, sep, file = file_path.rpartition('/')print(f"rpartition路径: Directory='{directory}', Sep='{sep}', File='{file}'") # 输出: Directory='/home/user/documents', Sep='/', File='report.pdf'

它们的好处是，即使找不到分隔符，也不会抛出错误，而是返回一个可预测的结构，这在编写健壮的代码时很有用。

re.split(pattern, string, maxsplit=0, flags=0)

：正则表达式分割当你的分隔符不是一个固定的字符串，而是一个模式，比如多个不同的分隔符（逗号或分号），或者由多个空白字符组成的任意序列，那么

re

模块的

re.split()

就是你的终极武器。它允许你使用正则表达式来定义分隔符，这提供了无与伦比的灵活性。

import re# 分割由逗号、分号或空格分隔的字符串complex_data = "apple,banana;cherry grapes"items = re.split(r'[,;s]+', complex_data) # r'[,;s]+'表示一个或多个逗号、分号或空白字符print(f"re.split复杂分割: {items}") # 输出: ['apple', 'banana', 'cherry', 'grapes']# 分割并保留分隔符 (通过在模式中使用捕获组)text_with_delimiters = "This is a sentence. Another one! And a third?"# (?:...) 是非捕获组，如果想保留分隔符，需要用捕获组 (...)parts_and_delimiters = re.split(r'([.!?])', text_with_delimiters)print(f"re.split保留分隔符: {parts_and_delimiters}") # 输出: ['This is a sentence', '.', ' Another one', '!', ' And a third', '?', '']# 注意：结果中可能包含空字符串，需要后处理

re.split()

功能强大，但代价是引入了正则表达式的复杂性。对于简单的任务，我还是倾向于用

str.split()

，只有当

str.split()

显得力不从心时，我才会考虑

re.split()

。

str.splitlines(keepends=False)

：按行分割这个方法是专门为处理多行字符串而设计的。它会根据所有常见的行结束符（

rn

）来分割字符串，并返回一个行的列表。

keepends

参数如果设置为

True

，则会保留行结束符在结果列表中。

multi_line_text = "Line 1nLine 2rnLine 3"lines = multi_line_text.splitlines()print(f"splitlines: {lines}") # 输出: ['Line 1', 'Line 2', 'Line 3']lines_with_ends = multi_line_text.splitlines(keepends=True)print(f"splitlines保留结束符: {lines_with_ends}") # 输出: ['Line 1n', 'Line 2rn', 'Line 3']

这比手动

split('n')

再处理

要优雅得多，尤其是在处理跨平台的文本文件时。

在实际项目中，如何选择合适的字符串分割方法并避免常见陷阱？

在我的日常开发中，选择合适的字符串分割方法，很大程度上取决于数据的来源、格式的规整程度，以及我最终想要得到什么。这就像你有一套工具箱，每把工具都有其最擅长的活儿。

我的选择逻辑通常是这样的：

最简单、最常用：

str.split()

(无参数)

何时选用： 当你需要根据任意空白字符（一个或多个空格、制表符、换行符）来分割字符串，并且希望自动去除首尾空白和过滤掉空字符串时。典型场景： 解析用户输入、处理非结构化的文本段落、清理从网页抓取的数据。我的心得： 这是我最常用的，因为它太“智能”了，能省去很多清理工作。如果你的数据格式比较“野”，先用它试试看，通常能得到一个不错的起点。

明确分隔符，但需要控制次数：

str.split(sep, maxsplit)

何时选用： 当你的分隔符是固定的单个字符或字符串，并且你只关心前几部分，或者不希望对整个字符串进行过度分割时。典型场景： 解析CSV行（如

line.split(',', maxsplit=N)

）、处理日志条目（如

log.split(':', maxsplit=1)

来分离时间戳和消息）。我的心得：

maxsplit

是个被低估的参数。它不仅能提升性能（因为不必处理整个字符串），还能简化逻辑，尤其是在处理那些“前面结构化，后面是自由文本”的数据格式时。

需要分隔符本身，或只关心首次/末次分割：

str.partition(sep)

/

str.rpartition(sep)

何时选用： 当你需要将字符串精确地分成三部分：分隔符之前、分隔符本身、分隔符之后，并且只关心第一次或最后一次出现的分隔符。典型场景： 从文件名中分离目录和文件（

rpartition('/')

）、从URL中分离协议和其余部分（

partition('://')

）、从键值对字符串中分离键和值（

partition('=')

）。我的心得： 它们比

find()

和手动切片更健壮，因为即使找不到分隔符，它们也会返回一个可预测的三元组，避免了

IndexError

。

复杂模式分割：

re.split(pattern, string)

何时选用： 当你的分隔符不是一个简单的固定字符串，而是一个复杂的模式，比如：多个不同的分隔符（逗号、分号、竖线）。由特定字符序列组成的任意长度分隔符（例如，多个空格或制表符）。需要根据正则表达式匹配的模式进行分割。典型场景： 解析高度不规则的日志文件、处理混合了多种分隔符的用户输入、从文本中提取特定类型的数据。我的心得： 这是“大杀器”，但也是“双刃剑”。正则表达式的强大带来了学习曲线，也可能让代码变得不易读。我通常会把它留给那些

str.split()

无法优雅解决的问题。记住，如果只是处理空白字符，

str.split()

（无参数）通常比

re.split(r's+', ...)

更简洁。

按行分割：

str.splitlines()

何时选用： 当你处理多行文本，需要根据各种标准的行结束符（

rn

）来分割时。典型场景： 读取文本文件内容并按行处理、解析多行用户输入。我的心得： 这是一个专门且高效的工具，避免了手动处理不同操作系统行结束符的麻烦。

常见陷阱与规避：

**陷阱1：

split(' ')

以上就是python如何分割字符串_python字符串分割split函数使用详解的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1371730.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Python函数中如何正确返回循环中的所有匹配结果

上一篇 2025年12月14日 11:42:10

python如何获取一个字典的值_python获取字典dict值的几种方法

下一篇 2025年12月14日 11:42:20

好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
4000
好文分享

为什么自定义样式表在 Safari 中访问百度页面时无法生效？

自定义样式表在 safari 中失效的原因用户尝试在 safari 偏好设置中添加自定义样式表，代码如下： body { background-image: url(“/users/luxury/desktop/wallhaven-o5762l.png”) !important;} 测试后发现，在…

程序猿
2025年12月24日
1000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
3000
如何在网页 F12 调试中查看鼠标悬停时才出现的 DOM 元素？

如何在网页 f12 调试中查看鼠标悬停时才出现的 dom 元素？在 f12 调试模式下，鼠标悬停时才出现的 dom 元素无法通过直接选择查看。解决方法根据显示原理的不同而有所区别： 1. css 控制的元素强制开启悬停状态：在 firefox 浏览器中，可以通过在开发者工具中手动开启选中元素的 …

程序猿
2025年12月24日 • 好文分享
2000
好文分享

如何直接访问 Sass 地图变量的值？

直接访问 sass 地图变量的值在 sass 中，我们可以使用地图变量来存储一组键值对。而有时候，我们可能需要直接访问其中的某个值。可以通过 map-get 函数直接从地图中获取特定的值。语法如下： map-get($map, $key) 其中： $map 是我们要获取值的 sass 地图变量。…

程序猿
2025年12月24日
0000
好文分享

TDesign UI库中小程序开发的CSS选择器：为什么“.t-grid–card”能生效？

TDesign UI库中CSS选择器困惑在小程序开发中，使用TDesign UI库时，您可能会遇到一个困惑的CSS选择器。例如，在DOM结构中，一个元素的class为”t-grid t-card class t-class”, 但其CSS选择器却是”&#8216…

程序猿
2025年12月24日
1000
好文分享

逻辑属性与旧版属性：如何根据文本方向选择合适的CSS属性？

CSS 逻辑属性与旧版属性 CSS 中引入了逻辑属性和旧版属性的概念。这些属性负责控制页面元素的外观和布局。逻辑属性逻辑属性以逻辑方向命名，如左右、上下。它们根据元素在文档流中的位置来确定元素的外观。例如：立即学习“前端免费学习笔记（深入）”； marginBlockStart：控制元素在垂直…

程序猿
2025年12月24日
1000
好文分享

CSS 逻辑属性和旧版属性：如何选择？

css逻辑属性与旧版属性 css中，逻辑属性和旧版属性用于控制元素的布局和外观。然而，两者在语法和使用方式上有所不同。逻辑属性逻辑属性是基于元素在现实世界中的预期行为来命名的。它使用诸如 “start”、”end” 和 “block&#…

程序猿
2025年12月24日
2000
好文分享

您不需要 CSS 预处理器

原生 css 在最近几个月/几年里取得了长足的进步。在这篇文章中，我将回顾人们使用 sass、less 和 stylus 等 css 预处理器的主要原因，并向您展示如何使用原生 css 完成这些相同的事情。分隔文件分离文件是人们使用预处理器的主要原因之一。尽管您已经能够将另一个文件导入到 css…

程序猿
2025年12月24日
1000
好文分享

动态样式类名为何失效：嵌套与并列选择器的区别在哪里？

动态样式类名不起作用：嵌套与并列问题在使用动态样式类名时，有时会遇到尽管触发事件但样式却没有改变的情况。这可能是由于使用了后代选择器而造成的。以提供的代码为例：块中，嵌套的类是content类的后代。这意味着类仅在元素包含子元素时才能生效。为了解决这个问题，需要将与类编写为并列，而不是嵌套方…

程序猿
2025年12月24日
3000
好文分享

CSS 定位属性：六种定位方式的区别是什么？

CSS中的定位属性及其区别 CSS中的 position 属性定义元素的定位行为，它共有六个可供选择的属性值，分别是：静态定位 (static)：默认值，元素按照正常文档流进行定位。相对定位 (relative)：元素相对于自身原本的位置进行偏移。绝对定位 (absolute)：元素相对于最近的非…

程序猿
2025年12月24日
1000
好文分享

父元素仅设置 Line-height 对子元素高度的影响：行内块级元素与块级元素有什么区别？

父元素仅设置 Line-height 对子元素的块级或行内块级元素的影响当父元素只设置了 Line-height 而没有设置高度时，对其子元素的影响将取决于子元素的类型。如果子元素是行内块级元素，如 inine-block，父元素的 Line-height 将成为子元素的高度。这是因为行内块级元…

程序猿
2025年12月24日
1000
好文分享

当父元素仅设置行高时，块级和行内块级元素的行为有何区别？

当父元素仅设置行高时，块级或行内块级子元素的行为在 html 中，当父元素仅设置行高 line-height 时，块级或行内块级元素的行为会有所不同。 <line-height: 60px; background-color: antiquewhite; 哈哈哈行内块级元素（display…

程序猿
2025年12月24日
3000
好文分享

Bear 博客上的浅色/深色模式分步指南

我最近使用偏好颜色方案媒体功能与 light-dark() 颜色函数相结合，在我的 bear 博客上实现了亮/暗模式切换。我是这样做的。第 1 步：设置 css css 在过去几年中获得了一些很酷的新功能，包括 light-dark() 颜色函数。此功能可让您为任何元素指定两种颜色 &#8211…

程序猿
2025年12月24日
2000
好文分享

为什么将perspective样式设置在带有transform-style: preserve-3d样式的元素的父级元素上才能得到预期的3D变换效果？

perspective必须设置在带有transform style: preserve-3d样式的元素的父级元素上吗？问题：你的HTML和CSS代码中，将perspective样式设置在了.scene元素上，当你将其移动到.cube元素后，效果却发生了变化。这是为什么？解答： perspect…

程序猿
2025年12月24日
1000
好文分享

perspective属性设置在父元素和后代元素上，对3D效果有什么区别？

perspective属性的位置对3d效果的影响通常情况下，perspective属性需要设置在应用了transform-style: preserve-3d属性的父元素上。然而，如果perspective属性设置在后代元素上会产生不同的效果。为了演示区别，让我们扩展已有的示例： front b…

程序猿
2025年12月24日
0000
好文分享

CSS perspective 属性，设置在不同元素上会产生什么区别？

perspective 属性在不同元素上的效果对比 CSS 中的 perspective 属性用于指定 3D 转换的视角距离。它可以通过改变物体相对于观察者的远近距离来创建三维效果。然而，将 perspective 设置在不同的元素上会产生不同的效果。根据提供的代码，我们将 perspective…

程序猿
2025年12月24日
0000
好文分享

## PostCSS vs. Sass/Less/Stylus：如何选择合适的 CSS 代码编译工具？

PostCSS 与 Sass/Less/Stylus：CSS 代码编译转换中的异同在 CSS 代码的编译转换领域，PostCSS 与 Sass/Less/Stylus 扮演着重要的角色，但它们的作用却存在细微差异。区别 PostCSS 主要是一种 CSS 后处理器，它在 CSS 代码编译后进行处…

程序猿
2025年12月24日
0000
好文分享

如何在 Web 开发中检测浏览器中的操作系统暗模式？

检测浏览器中的操作系统暗模式在 web 开发中，用户界面适应操作系统（os）的暗模式设置变得越来越重要。本文将重点介绍检测浏览器中 os 暗模式的方法，从而使网站能够针对不同模式调整其设计。 w3c media queries level 5 最新的 web 标准引入了 prefers-color…

程序猿
2025年12月24日
1000
好文分享

如何使用 CSS 检测操作系统是否处于暗模式？

如何在浏览器中检测操作系统是否处于暗模式？新发布的 os x 暗模式提供了在 mac 电脑上使用更具沉浸感的用户界面，但我们很多人都想知道如何在浏览器中检测这种设置。新标准检测操作系统暗模式的解决方案出现在 w3c media queries level 5 中的最新标准中：立即学习“前端免…

程序猿
2025年12月24日
1000