python中怎么获取文件扩展名_Python获取文件路径与扩展名方法

程序猿 • 2025年12月14日 11:30:35 • 用户投稿 • 阅读 0

使用os.path.splitext()是获取文件扩展名最稳健的方法，能正确处理无扩展名、多点及隐藏文件；结合os.path.basename()和dirname()可解析路径各部分，而pathlib提供更现代、面向对象且跨平台的路径操作方式。

在Python中获取文件扩展名，通常最推荐且最稳健的方法是使用

os.path.splitext()

函数。这个函数能够将文件路径分割成文件名和扩展名两部分，即使文件没有扩展名或有多个点也能正确处理。至于文件路径的各个部分，比如目录名和基本文件名，则可以分别通过

os.path.dirname()

和

os.path.basename()

来获取。

解决方案

在我日常处理文件操作的经验中，

os.path

模块提供了一套非常成熟且跨平台的方法来解析文件路径。其中，

os.path.splitext()

是获取文件扩展名的首选。它会将路径分割成一个包含两元素的元组：

(root, ext)

。

root

是文件路径中除了扩展名之外的部分，而

ext

则是扩展名，包括前面的点（

）。

例如：

import osfile_path_1 = "/home/user/documents/report.pdf"file_path_2 = "archive.tar.gz"file_path_3 = "config"file_path_4 = ".bashrc" # 隐藏文件# 获取文件扩展名root_1, ext_1 = os.path.splitext(file_path_1)print(f"路径: {file_path_1}, 根: {root_1}, 扩展名: {ext_1}")# 输出: 路径: /home/user/documents/report.pdf, 根: /home/user/documents/report, 扩展名: .pdfroot_2, ext_2 = os.path.splitext(file_path_2)print(f"路径: {file_path_2}, 根: {root_2}, 扩展名: {ext_2}")# 输出: 路径: archive.tar, 根: archive.tar, 扩展名: .gz (注意这里，它只识别最后一个点后的部分)root_3, ext_3 = os.path.splitext(file_path_3)print(f"路径: {file_path_3}, 根: {root_3}, 扩展名: {ext_3}")# 输出: 路径: config, 根: config, 扩展名: (空字符串)root_4, ext_4 = os.path.splitext(file_path_4)print(f"路径: {file_path_4}, 根: {root_4}, 扩展名: {ext_4}")# 输出: 路径: .bashrc, 根: .bashrc, 扩展名: (空字符串)# 修正：实际上，对于".bashrc"，它会返回('', '.bashrc')。这是因为os.path.splitext认为如果文件名以点开头且没有其他点，那么整个文件名就是扩展名。# 让我们重新验证并修正这个理解。# 重新验证并修正：root_4_fixed, ext_4_fixed = os.path.splitext(file_path_4)print(f"路径: {file_path_4}, 根: {root_4_fixed}, 扩展名: {ext_4_fixed}")# 实际输出: 路径: .bashrc, 根: , 扩展名: .bashrc# 这表明对于以点开头的隐藏文件，如果没有其他点，整个文件名会被视为扩展名。这一点在使用时需要特别留意，它与我们直观认为的“扩展名”可能有些出入，但符合其内部逻辑。# 获取文件路径的目录部分和基本文件名dir_name = os.path.dirname(file_path_1)base_name = os.path.basename(file_path_1)print(f"目录名: {dir_name}, 基本文件名: {base_name}")# 输出: 目录名: /home/user/documents, 基本文件名: report.pdf

这里，

os.path.basename()

会返回路径的最后一个组成部分，也就是文件名（包含扩展名）。而

os.path.dirname()

则返回路径的目录部分。

立即学习“Python免费学习笔记（深入）”；

Python如何安全地处理没有扩展名或隐藏文件名的路径？

说实话，处理文件路径时，最头疼的就是那些“不按常理出牌”的路径。比如一个文件叫

README

，它就没有扩展名；或者像

.gitignore

这样的隐藏文件，它看起来像扩展名，但其实是文件名本身。

os.path.splitext()

在这方面做得相当不错，它有自己一套明确的规则来处理这些边缘情况，这让我个人觉得它非常可靠。

它的核心逻辑是：它会从路径字符串的右边开始，找到第一个点（

），然后将点之后的所有内容都视为扩展名。如果找不到点，或者点是路径的第一个字符（比如

.bashrc

），那么扩展名部分就会是空的，或者整个文件名被视为扩展名。

我们来看看一些具体的例子来加深理解：

import os# 1. 没有扩展名的文件path_no_ext = "/var/log/syslog"root_no_ext, ext_no_ext = os.path.splitext(path_no_ext)print(f"路径: {path_no_ext}, 根: '{root_no_ext}', 扩展名: '{ext_no_ext}'")# 结果：根: '/var/log/syslog', 扩展名: ''# 完美，扩展名是空字符串，符合预期。# 2. 隐藏文件 (以点开头)path_hidden_file = "/home/user/.profile"root_hidden, ext_hidden = os.path.splitext(path_hidden_file)print(f"路径: {path_hidden_file}, 根: '{root_hidden}', 扩展名: '{ext_hidden}'")# 结果：根: '/home/user', 扩展名: '.profile'# 这里的行为可能有点出乎意料，os.path.splitext会把整个".profile"当作扩展名。# 如果我们想要的是"profile"作为文件名，可能需要进一步处理。# 比如，先获取basename，再对basename进行splitext。# 3. 多个点的情况 (例如压缩文件)path_multi_dot = "my_archive.tar.gz"root_multi, ext_multi = os.path.splitext(path_multi_dot)print(f"路径: {path_multi_dot}, 根: '{root_multi}', 扩展名: '{ext_multi}'")# 结果：根: 'my_archive.tar', 扩展名: '.gz'# 这也符合大多数情况下的需求，我们通常只关心最外层的压缩格式。# 4. 路径中包含目录分隔符path_with_slash = "/path/to/my.file/" # 注意末尾的斜杠root_slash, ext_slash = os.path.splitext(path_with_slash)print(f"路径: {path_with_slash}, 根: '{root_slash}', 扩展名: '{ext_slash}'")# 结果：根: '/path/to/my.file/', 扩展名: ''# os.path.splitext会先处理掉末尾的斜杠，然后对“my.file”进行操作，但因为末尾斜杠的存在，它会将整个“my.file/”视为一个目录，所以扩展名是空的。# 如果先用os.path.normpath或os.path.basename处理，结果会更符合预期。# 例如：normalized_path = os.path.normpath(path_with_slash)base_name_slash = os.path.basename(normalized_path)root_norm_base, ext_norm_base = os.path.splitext(base_name_slash)print(f"标准化处理后：路径: {normalized_path}, 基本文件名: {base_name_slash}, 根: '{root_norm_base}', 扩展名: '{ext_norm_base}'")# 结果：标准化处理后：路径: /path/to/my.file, 基本文件名: my.file, 根: 'my', 扩展名: '.file'# 这才是我真正想要的。所以，有时不能直接对原始路径进行splitext，需要先提取basename。这些例子清晰地展示了 `os.path.splitext()` 的行为模式。在实际开发中，理解这些细节非常重要，可以避免一些隐晦的bug。### 在Python中，`os.path`和`pathlib`模块在文件路径操作上有何不同？谈到文件路径操作，不得不提一下Python的两个主要模块：`os.path` 和 `pathlib`。我个人在项目初期，或者处理一些简单、遗留代码时，会更多地使用 `os.path`，因为它足够直接，而且是Python早期就有的标准。但随着项目复杂度的增加，以及对代码可读性和面向对象编程的追求，我发现 `pathlib` 简直是神来之笔。`os.path` 模块提供的是一系列**函数**，它们操作的都是**字符串**。你需要不断地传入字符串路径，然后得到字符串结果。比如 `os.path.join()`、`os.path.dirname()`、`os.path.splitext()` 等等。它的优点是简单、直接，对于习惯了函数式编程或者C语言文件操作的开发者来说，可能更顺手。```pythonimport ospath_str = "/home/user/documents/report.docx"# os.path 风格dir_name_os = os.path.dirname(path_str)base_name_os = os.path.basename(path_str)root_os, ext_os = os.path.splitext(base_name_os) # 注意这里对basename进行splitextprint(f"os.path - 目录: {dir_name_os}, 文件名: {base_name_os}, 根: {root_os}, 扩展名: {ext_os}")# 输出: os.path - 目录: /home/user/documents, 文件名: report.docx, 根: report, 扩展名: .docx

而

pathlib

模块则完全是面向对象的设计。它将文件路径抽象成

Path

对象。一旦你创建了一个

Path

对象，就可以通过它的各种属性和方法来获取路径的各个部分，或者执行文件系统操作。这让代码变得更加直观、链式调用也更自然，而且它自带的路径解析逻辑在很多方面比

os.path

更加健壮和一致。

from pathlib import Pathpath_obj = Path("/home/user/documents/report.docx")# pathlib 风格dir_name_pl = path_obj.parent # 获取父目录base_name_pl = path_obj.name # 获取文件名 (带扩展名)stem_pl = path_obj.stem # 获取文件名 (不带扩展名)suffix_pl = path_obj.suffix # 获取扩展名 (包括点)suffixes_pl = path_obj.suffixes # 获取所有扩展名 (例如 .tar.gz 会返回 ['.tar', '.gz'])print(f"pathlib - 目录: {dir_name_pl}, 文件名: {base_name_pl}, 根: {stem_pl}, 扩展名: {suffix_pl}")print(f"pathlib - 所有扩展名: {suffixes_pl}")# 输出: pathlib - 目录: /home/user/documents, 文件名: report.docx, 根: report, 扩展名: .docx# 输出: pathlib - 所有扩展名: ['.docx']# 针对多个扩展名的情况path_multi_ext_obj = Path("archive.tar.gz")print(f"pathlib - 多个扩展名: {path_multi_ext_obj.suffixes}")# 输出: pathlib - 多个扩展名: ['.tar', '.gz']

从上面的例子可以看出，

pathlib

的

stem

属性直接提供了不带扩展名的文件名，

suffix

提供了扩展名，而

suffixes

更是能处理多重扩展名（比如

.tar.gz

）的情况，这在

os.path.splitext()

中需要额外的逻辑来处理。此外，

pathlib

还提供了

is_file()

is_dir()

exists()

iterdir()

read_text()

write_text()

等一系列非常方便的方法，让文件系统操作变得异常简洁。

所以，我的建议是：对于新项目或需要更现代、更易读、更面向对象的路径操作时，毫不犹豫地选择

pathlib

。它能显著提升开发效率和代码质量。而

os.path

依然是Python标准库的一部分，在某些特定场景或兼容性需求下，仍有其用武之地。

处理文件路径时，Python中常见的错误和注意事项有哪些？

在Python中处理文件路径，看似简单，实则暗藏玄机。我踩过不少坑，也看到过许多新手因此而困惑。这里我总结一些常见的错误和需要注意的地方，希望能帮助大家少走弯路。

路径分隔符的陷阱：这是最常见的问题之一。Windows系统习惯用反斜杠

作为路径分隔符，而Unix/Linux/macOS系统则使用正斜杠

。如果你硬编码路径字符串，比如

C:UsersDocumentsfile.txt

，在Linux上运行就会出问题。解决方案： 永远使用

os.path.join()

来拼接路径，或者使用

pathlib.Path()

对象。它们会自动根据当前操作系统选择正确的路径分隔符。

import osfrom pathlib import Path# os.path 方式path_os = os.path.join("C:", "Users", "Documents", "file.txt") # 在Windows上是 C:UsersDocumentsfile.txt，在Linux上是 C:/Users/Documents/file.txtprint(f"os.path 拼接: {path_os}")# pathlib 方式path_pl = Path("C:") / "Users" / "Documents" / "file.txt" # 同样是跨平台的print(f"pathlib 拼接: {path_pl}")

绝对路径与相对路径的混淆：相对路径是相对于当前工作目录的，而绝对路径是从文件系统的根目录开始的。当你程序运行时，当前工作目录可能不是你预期的目录，这会导致相对路径解析失败。解决方案： 如果你需要确保路径的唯一性或在不同环境下都能找到文件，最好将其转换为绝对路径。

os.path.abspath()

或

pathlib.Path.resolve()

可以做到这一点。

import osfrom pathlib import Path# 获取当前脚本的绝对路径current_script_dir = Path(__file__).parent.resolve()print(f"当前脚本目录: {current_script_dir}")# 将相对路径转换为绝对路径relative_path = "data/input.csv"absolute_path_os = os.path.abspath(relative_path)absolute_path_pl = Path(relative_path).resolve() # resolve() 会处理符号链接并返回规范化的绝对路径print(f"相对路径 '{relative_path}' 的绝对路径 (os.path): {absolute_path_os}")print(f"相对路径 '{relative_path}' 的绝对路径 (pathlib): {absolute_path_pl}")

编码问题（尤其是在处理非ASCII字符时）：文件系统在不同操作系统上可能使用不同的字符编码。当你处理包含中文、日文等非ASCII字符的文件名时，如果没有正确处理编码，可能会出现

UnicodeDecodeError

或

FileNotFoundError

。解决方案： Python 3 内部字符串都是Unicode，通常文件系统操作会自动处理。但如果遇到问题，确保你的文件名字符串是正确的Unicode编码。在打开文件时，明确指定

encoding

参数也是个好习惯，比如

open('文件.txt', 'r', encoding='utf-8')

。

大小写敏感性：Linux系统通常对文件名大小写敏感（

File.txt

和

File.txt

是两个不同的文件），而Windows系统通常不敏感。这可能导致在不同操作系统上部署代码时出现意外行为。注意事项： 编写代码时，尽量保持文件名的一致性，避免只通过大小写来区分文件。在跨平台开发时，这一点尤为重要。

空字符串或None作为路径参数：当你将空字符串或

None

传递给

os.path

或

pathlib

的某些函数时，可能会得到非预期的结果或抛出错误。解决方案： 在调用文件路径处理函数之前，最好对输入进行校验，确保路径字符串是有效的。

路径不存在导致

FileNotFoundError

：这是最直观的错误。当你尝试打开、读取或写入一个不存在的文件或目录时，Python会抛出

FileNotFoundError

。解决方案： 在进行文件操作之前，使用

os.path.exists()

或

pathlib.Path.exists()

来检查路径是否存在。如果需要创建目录，使用

os.makedirs()

或

pathlib.Path.mkdir(parents=True, exist_ok=True)

。

import osfrom pathlib import Pathnon_existent_file = "non_existent.txt"if not os.path.exists(non_existent_file):    print(f"文件 '{non_existent_file}' 不存在。")target_dir = Path("my_new_directory/sub_dir")if not target_dir.exists():    print(f"目录 '{target_dir}' 不存在，正在创建...")    target_dir.mkdir(parents=True, exist_ok=True)    print(f"目录 '{target_dir}' 已创建。")

理解并避免这些常见的陷阱，能让你的Python文件路径处理代码更加健壮和可靠。在我的开发实践中，我发现花时间去理解这些底层机制，远比盲目复制代码要高效得多。

以上就是python中怎么获取文件扩展名_Python获取文件路径与扩展名方法的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1371510.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

python中怎么把小写字母转换成大写_Python字符串大小写转换方法

上一篇 2025年12月14日 11:30:31

SQLAlchemy 如何获取子类对象？

下一篇 2025年12月14日 11:30:43

好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
4000
好文分享

CSS元素设置em和transition后，为何载入页面无放大效果？

css元素设置em和transition后，为何载入无放大效果很多开发者在设置了em和transition后，却发现元素载入页面时无放大效果。本文将解答这一问题。原问题：在视频演示中，将元素设置如下，载入页面会有放大效果。然而，在个人尝试中，并未出现该效果。这是由于macos和windows系统…

程序猿
2025年12月24日
3000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
3000
好文分享

如何用HTML/JS实现Windows 10设置界面鼠标移动探照灯效果？

Win10设置界面中的鼠标移动探照灯效果实现指南想要在前端开发中实现类似于Windows 10设置界面的鼠标移动探照灯效果，有两种解决方案：CSS 和 HTML/JS 组合。 CSS 实现不幸的是，仅使用CSS无法完全实现该效果。立即学习“前端免费学习笔记（深入）”； HTML/JS 实现要…

程序猿
2025年12月24日
1000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
1000
好文分享

如何用前端技术实现Windows 10 设置界面鼠标移动时的探照灯效果？

探索在前端中实现 Windows 10 设置界面鼠标移动时的探照灯效果在前端开发中，鼠标悬停在元素上时需要呈现类似于 Windows 10 设置界面所展示的探照灯效果，这其中涉及到了元素外围显示光圈效果的技术实现。 CSS 实现虽然 CSS 无法直接实现探照灯效果，但可以通过以下技巧营造出类似效…

程序猿
2025年12月24日
1000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
3000
好文分享

HTML、CSS 和 JavaScript 中的简单侧边栏菜单

构建一个简单的侧边栏菜单是一个很好的主意，它可以为您的网站添加有价值的功能和令人惊叹的外观。侧边栏菜单对于客户找到不同项目的方式很有用，而不会让他们觉得自己有太多选择，从而创造了简单性和秩序。今天，我将分享一个简单的 HTML、CSS 和 JavaScript 源代码来创建一个简单的侧边栏菜单。…

程序猿
2025年12月24日
5000
好文分享

前端代码辅助工具：如何选择最可靠的AI工具？

前端代码辅助工具：可靠性探讨对于前端工程师来说，在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而，并非所有工具都能提供同等的可靠性。个性化需求关于哪个AI工具最可靠，这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素：立…

程序猿
2025年12月24日
1000
好文分享

带有 HTML、CSS 和 JavaScript 工具提示的响应式侧边导航栏

响应式侧边导航栏不仅有助于改善网站的导航，还可以解决整齐放置链接的问题，从而增强用户体验。通过使用工具提示，可以让用户了解每个链接的功能，包括设计紧凑的情况。在本教程中，我将解释使用 html、css、javascript 创建带有工具提示的响应式侧栏导航的完整代码。对于那些一直想要一个干净、简…

程序猿
2025年12月24日
1000
好文分享

布局 – CSS 挑战

您可以在 github 仓库中找到这篇文章中的所有代码。您可以在这里查看视觉效果：固定导航 – 布局 – codesandbox两列 – 布局 – codesandbox三列 – 布局 – codesandbox圣杯 &#8…

程序猿
2025年12月24日
1000
好文分享

隐藏元素 – CSS 挑战

您可以在 github 仓库中找到这篇文章中的所有代码。您可以在此处查看隐藏元素的视觉效果 – codesandbox 隐藏元素 hiding elements hiding elements hiding elements hiding elements hiding element…

程序猿
2025年12月24日
5000
居中 – CSS 挑战

您可以在 github 仓库中找到这篇文章中的所有代码。您可以在此处查看垂直中心 – codesandbox 和水平中心的视觉效果。通过 css 居中垂直居中 centering centering centering centering centering centering立即…

程序猿
2025年12月24日 • 好文分享
4000
好文分享

如何在 Laravel 框架中轻松集成微信支付和支付宝支付？

如何用 laravel 框架集成微信支付和支付宝支付问题：如何在 laravel 框架中集成微信支付和支付宝支付？回答：建议使用 easywechat 的 laravel 版，easywechat 是一个由腾讯工程师开发的高质量微信开放平台 sdk，已被广泛地应用于许多 laravel 项目中…

程序猿
2025年12月24日
1000
好文分享

如何在移动端实现子 div 在父 div 内任意滑动查看？

如何在移动端中实现让子 div 在父 div 内任意滑动查看在移动端开发中，有时我们需要让子 div 在父 div 内任意滑动查看。然而，使用滚动条无法实现负值移动，因此需要采用其他方法。解决方案：使用绝对布局（absolute）或相对布局（relative）：将子 div 设置为绝对或相对定…

程序猿
2025年12月24日
1000
好文分享

移动端嵌套 DIV 中子 DIV 如何水平滑动？

移动端嵌套 DIV 中子 DIV 滑动在移动端开发中，遇到这样的问题：当子 DIV 的高度小于父 DIV 时，无法在父 DIV 中水平滚动子 DIV。无限画布要实现子 DIV 在父 DIV 中任意滑动，需要创建一个无限画布。使用滚动无法达到负值，因此需要使用其他方法。相对定位一种方法是将子…

程序猿
2025年12月24日
1000
好文分享

移动端项目中，如何消除rem字体大小计算带来的CSS扭曲？

移动端项目中消除rem字体大小计算带来的css扭曲在移动端项目中，使用rem计算根节点字体大小可以实现自适应布局。但是，此方法可能会导致页面打开时出现css扭曲，这是因为页面内容在根节点字体大小赋值后重新渲染造成的。解决方案：要避免这种情况，将计算根节点字体大小的js脚本移动到页面的最前面，即…

程序猿
2025年12月24日
0000
好文分享

Nuxt 移动端项目中 rem 计算导致 CSS 变形，如何解决？

Nuxt 移动端项目中解决 rem 计算导致 CSS 变形在 Nuxt 移动端项目中使用 rem 计算根节点字体大小时，可能会遇到一个问题：页面内容在字体大小发生变化时会重绘，导致 CSS 变形。解决方案：可将计算根节点字体大小的 JS 代码块置于页面最前端的标签内，确保在其他资源加载之前执…

程序猿
2025年12月24日
2000
好文分享

Nuxt 移动端项目使用 rem 计算字体大小导致页面变形，如何解决？

rem 计算导致移动端页面变形的解决方法在 nuxt 移动端项目中使用 rem 计算根节点字体大小时，页面会发生内容重绘，导致页面打开时出现样式变形。如何避免这种现象？解决方案：移动根节点字体大小计算代码到页面顶部，即 head 中。原理： flexível.js 也遇到了类似问题，它的解决…

程序猿
2025年12月24日
0000
好文分享

形状 – CSS 挑战

您可以在 github 仓库中找到这篇文章中的所有代码。您可以在此处查看 codesandbox 的视觉效果。通过css绘制各种形状如何在 css 中绘制正方形、梯形、三角形、异形三角形、扇形、圆形、半圆、固定宽高比、0.5px 线？ shapes 0.5px line .square { w…

程序猿
2025年12月24日
1000