如何打包你的 Python 项目?setuptools 与 wheel

答案:Python项目打包需用pyproject.toml定义元数据和依赖,结合setuptools生成wheel包,实现代码分发、依赖管理与跨环境部署,提升可维护性和协作效率。

如何打包你的 python 项目?setuptools 与 wheel

打包Python项目,核心在于将其代码、依赖和元数据组织成一个可分发的格式,最常见的就是使用

setuptools

来定义项目结构,并通过它生成

wheel

格式的二进制分发包(以及

sdist

源码分发包),以便其他人或系统能轻松安装和使用。这不仅仅是了上传到PyPI,更是为了项目自身的模块化、可维护性和协作效率。

解决方案

说实话,刚开始接触Python打包时,我个人觉得这玩意儿有点玄乎,各种配置文件和概念堆在一起。但一旦你理解了核心逻辑,它其实非常直观。现代Python项目的打包流程,强烈推荐使用

pyproject.toml

结合

build

工具

项目结构准备:一个典型的、推荐的项目结构会是这样:

my_project/├── src/│   └── my_package/│       ├── __init__.py│       └── module_a.py├── pyproject.toml├── README.md├── LICENSE├── requirements.txt (可选,用于开发环境)└── .gitignore

这里

src/

目录非常关键,它将你的包代码与项目根目录下的其他文件(如文档、测试、配置文件)清晰地分离。这避免了在开发模式下Python解释器意外地从项目根目录加载包的问题。

pyproject.toml

文件配置:这是你的项目元数据和构建系统定义的核心文件。它遵循TOML格式,比传统的

setup.py

更声明式,更易于理解和维护。

[build-system]requires = ["setuptools>=61.0", "wheel"]build-backend = "setuptools.build_meta"[project]name = "my-awesome-package"version = "0.1.0"description = "一个超棒的Python项目,解决你的所有烦恼。"readme = "README.md"requires-python = ">=3.8"license = { file = "LICENSE" }keywords = ["awesome", "utility", "python"]authors = [    { name = "你的名字", email = "你的邮箱@example.com" },]maintainers = [    { name = "另一个贡献者", email = "另一个邮箱@example.com" },]classifiers = [    "Programming Language :: Python :: 3",    "License :: OSI Approved :: MIT License",    "Operating System :: OS Independent",]dependencies = [    "requests>=2.28.1",    "numpy",    # 更多依赖...][project.urls]"Homepage" = "https://github.com/你的用户名/my_project""Bug Tracker" = "https://github.com/你的用户名/my_project/issues""Documentation" = "https://my_project.readthedocs.io/"[tool.setuptools.packages.find]where = ["src"] # 告诉setuptools在src目录下查找包

这里我们定义了构建系统(使用

setuptools

作为后端),然后是项目的基本信息、依赖、作者、许可证等。

[tool.setuptools.packages.find]

部分是告诉

setuptools

src

目录下找你的Python包。

立即学习“Python免费学习笔记(深入)”;

安装构建工具:你需要安装

build

工具来执行打包操作。

pip install build

执行打包:在你的项目根目录(

pyproject.toml

所在的目录)下运行:

python -m build

这个命令会执行构建过程,通常会在项目根目录下生成一个

dist/

目录。里面会包含两个文件:

my_awesome_package-0.1.0-py3-none-any.whl

(Wheel 文件,二进制分发包)

my_awesome_package-0.1.0.tar.gz

(Source Distribution,源码分发包)

现在,你就可以用

pip install dist/my_awesome_package-0.1.0-py3-none-any.whl

来安装你的包了,或者将其上传到PyPI。

为什么我的Python项目需要打包?

老实说,一开始我只是写脚本,本地跑跑,根本没想过打包这回事。但随着项目代码量上去,或者需要给别人用,甚至只是自己换台机器部署,就会发现不打包简直是自找麻烦。

核心原因在于:可重复性、可维护性和协作效率。

想想看,如果你写了一个工具,里面用到了

requests

pandas

这些库。如果只是把代码文件扔给别人,他们怎么知道要安装哪些依赖?版本对不对?打包就解决了这个问题。它把你的代码、依赖信息、版本号、作者、许可证等所有元数据都封装在一起,形成一个标准的、可安装的单元。

对于个人项目,打包意味着你可以轻松地在不同环境(比如开发机、测试服务器、生产环境)部署你的代码,确保依赖的一致性。对于团队协作,它提供了一个清晰的接口,让团队成员能够像使用任何第三方库一样使用你开发的模块,而不需要深入了解其内部结构。更重要的是,它为你的项目走向公开(比如发布到PyPI)铺平了道路,让全世界都能轻松地使用你的劳动成果。这不仅仅是技术上的必要,更是一种代码工程化和专业化的体现。

setuptools

wheel

:它们到底是什么关系?

理解

setuptools

wheel

的关系,就好比理解建筑师和预制板的关系。

setuptools

,你可以把它看作是项目的“建筑师”和“施工方”。它定义了你的项目应该如何被构建。它负责:

元数据管理:读取

pyproject.toml

(或

setup.py

)中定义的项目名称、版本、作者、依赖等信息。包发现:根据你的配置(比如

where = ["src"]

),找到项目中实际的Python模块和包。资源包含:确保像配置文件、数据文件等非Python代码也能被打包进去。依赖解析:处理你项目所依赖的其他库。构建指令:最终,它会执行一系列操作,将你的源代码和所有相关信息转换成可分发的格式。

简单来说,

setuptools

是那个知道如何把你的散乱代码和配置变成一个有组织的、可安装的“东西”的引擎。

wheel

,则是这个“东西”的最终“预制件”。它是一种二进制分发格式。想象一下,如果

setuptools

把你的项目“盖”好了,那么

wheel

就是那个已经打包好的、可以直接搬到工地上(你的Python环境里)安装的“预制房屋”。

它的特点是:

预编译:如果你的项目包含C扩展(例如

numpy

),

wheel

文件通常会包含这些预编译好的二进制文件,省去了用户在安装时进行编译的步骤,大大加快了安装速度。平台特定:一个

wheel

文件可能只适用于特定的Python版本和操作系统架构(尽管很多纯Python包是

any

,即通用)。安装快速

pip

可以直接解压

wheel

文件并将其内容放置到正确的位置,无需执行任何构建步骤。

所以,它们的关系是:

setuptools

(作为构建后端)使用

wheel

格式来生成最终的可分发包。

setuptools

负责“制造”这个“预制件”,而

wheel

本身就是这个“预制件”的标准格式。当你运行

python -m build

时,

setuptools

会按照

pyproject.toml

的指示,最终输出

.whl

(以及

.tar.gz

)文件。

pyproject.toml

vs

setup.py

:我该选择哪一个?

这个问题,在我看来,几乎没有争议:强烈推荐使用

pyproject.toml

过去,

setup.py

是Python项目打包的黄金标准。它是一个Python脚本,这意味着你可以用Python的全部灵活性来定义你的打包逻辑。你可以编写复杂的条件语句,动态地生成元数据,或者执行一些自定义的构建步骤。

# 示例:setup.py (不推荐,但了解一下)from setuptools import setup, find_packagessetup(    name="my_legacy_package",    version="0.1.0",    packages=find_packages(where="src"),    package_dir={"": "src"},    install_requires=[        "requests>=2.28.1",        "numpy",    ],    # ... 更多配置)

然而,这种灵活性也带来了问题。

setup.py

需要被执行才能获取到项目的元数据,这使得工具链(比如

pip

)在处理它时变得复杂。它可能引入副作用,或者依赖于特定的Python环境才能正确运行。这导致了所谓的“构建隔离”问题,即构建工具本身可能需要依赖项目本身的依赖才能运行,形成循环依赖。

pyproject.toml

,则是Python打包生态系统迈向现代化的关键一步(通过PEP 517和PEP 518)。它是一个声明式的配置文件,用TOML格式编写。这意味着:

元数据是静态的:工具可以在不执行任何Python代码的情况下,直接解析

pyproject.toml

来获取项目的元数据。这大大简化了构建工具的工作。构建系统隔离

pyproject.toml

明确定义了构建项目所需的工具(如

setuptools

wheel

),这些工具会在一个隔离的环境中安装和运行,避免了与项目运行时依赖的冲突。标准化:它提供了一个统一的入口点,不仅

setuptools

可以使用,像

Poetry

Flit

这样的替代构建工具也可以使用。更清晰:TOML格式本身就比Python脚本更适合表达配置,结构清晰,易于阅读和维护。

尽管

setup.py

仍然被大量遗留项目使用,并且在某些极度复杂的定制化构建场景下可能仍有其用武之地,但对于绝大多数新项目和现有项目的迁移,

pyproject.toml

都是毫无疑问的最佳选择。它代表了Python打包的未来,提供了更健壮、更可预测、更易于管理的构建体验。我的建议是,从一开始就拥抱

pyproject.toml

,你会省去很多不必要的麻烦。

以上就是如何打包你的 Python 项目?setuptools 与 wheel的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1369728.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 09:54:51
下一篇 2025年12月14日 09:55:08

相关推荐

  • 什么是Python的wheel包?

    Wheel包是预编译的二进制分发格式,安装快且稳定;2. 与需编译的源码包不同,wheel即装即用,尤其利于含C扩展的库;3. 多数情况应优先选用wheel,特殊情况如定制代码或无匹配包时用sdist;4. 构建wheel需setuptools和wheel,运行python setup.py bdi…

    好文分享 2025年12月14日
    000
  • is和==在Python中有什么区别?

    is比较对象身份,==比较对象值;is用于身份判断如None检查,==用于内容相等性比较,应根据语义选择。 在Python中, is 和 == 虽然都用于比较,但它们关注的侧重点截然不同。简单来说, is 比较的是两个变量是否指向内存中的同一个对象,也就是它们的“身份”是否一致;而 == 比较的则是…

    2025年12月14日
    000
  • 如何求一个数的平方根?

    求平方根的核心是找到非负数x使x²=S,常用牛顿迭代法:xₙ₊₁=0.5(xₙ+S/xₙ),收敛快;手算可用分组试商法;负数无实平方根因实数平方非负;估算可找邻近完全平方数夹逼,如√150≈12.24。 求一个数的平方根,核心在于找到一个非负数,它与自身相乘后等于我们想要开平方的那个数。这听起来简单…

    2025年12月14日
    000
  • 如何用Python处理大文件?

    处理大文件的核心是避免一次性加载,采用逐行或分块读取,利用迭代器、生成器、pandas分块和mmap等方法实现流式处理,确保内存可控。 在Python中处理大文件,最核心的思路就是“不要一次性把所有数据都加载到内存里”。无论是文本文件、日志还是大型数据集,我们都需要采用流式处理或分块处理的策略,避免…

    2025年12月14日
    000
  • 迭代器(Iterator)与生成器(Generator)详解

    迭代器和生成器通过按需生成数据提升内存效率与代码简洁性,迭代器需实现__iter__和__next__方法,生成器则用yield简化迭代器创建,适用于处理大数据、无限序列及延迟计算场景。 迭代器(Iterator)和生成器(Generator)在Python编程中是处理序列数据,尤其是大型或无限序列…

    2025年12月14日
    000
  • Python字典的底层实现原理是什么?

    Python字典通过哈希表实现O(1)平均时间复杂度,其核心在于哈希函数、开放寻址冲突解决和动态扩容机制。 Python字典的底层实现核心在于其哈希表(Hash Table)的实现。它通过将键(Key)映射到一个存储位置来快速存取值(Value),这使得大多数操作都能保持接近常数时间复杂度,也就是我…

    2025年12月14日
    000
  • 可变对象与不可变对象在 Python 中的区别

    可变对象创建后可修改内容而不改变内存地址,如列表、字典;不可变对象一旦创建内容不可变,任何修改都会生成新对象,如整数、字符串、元组。 Python中的可变对象和不可变对象,核心区别在于对象创建后其内部状态是否可以被修改。简单来说,如果一个对象在内存中的值(或者说它引用的数据)可以在不改变其内存地址的…

    2025年12月14日
    000
  • Python中的*args和**kwargs有什么作用和区别?

    args和kwargs用于增强函数灵活性,args收集位置参数为元组,kwargs收集关键字参数为字典,二者在函数定义中收集参数,在调用时可解包传递,适用于可变参数场景。 *args 和 **kwargs 是Python中两个非常强大的语法糖,它们允许函数接受可变数量的参数。简单来说, *args …

    2025年12月14日
    000
  • 如何使用Python发送HTTP请求(requests库)?

    答案:使用requests库可简洁发送HTTP请求。通过get()、post()等方法发送请求,配合params、headers、json等参数传递数据,利用raise_for_status()处理错误,使用Session保持会话、复用连接,提升效率与代码可读性。 Python中发送HTTP请求,最…

    2025年12月14日
    000
  • 如何反转一个字符串?

    反转字符串的核心是将字符顺序倒置,常用方法包括语言内置函数(如Python切片、JavaScript的split-reverse-join)、手动循环和递归。内置方法最简洁高效,时间复杂度O(n),推荐优先使用;手动循环适用于需精细控制的场景;递归虽优雅但有栈溢出风险,慎用于长字符串。实际应用包括回…

    2025年12月14日
    000
  • 使用 Matplotlib 和 Seaborn 进行数据可视化

    Matplotlib 提供精细控制,Seaborn 简化统计绘图,两者结合可高效实现数据可视化:先用 Seaborn 快速探索数据,再用 Matplotlib 调整细节与布局,实现美观与功能的统一。 在使用 Python 进行数据可视化时,Matplotlib 和 Seaborn 无疑是两把利器。它…

    2025年12月14日
    000
  • Python中处理包含转义字符的JSON字符串:深入理解原始字符串与F-字符串

    本文深入探讨了在Python中处理包含转义字符的JSON字符串时,原始字符串(r前缀)和F-字符串(f前缀)的使用误区与正确实践。核心问题在于Python字符串字面量解析与JSON转义规则之间的差异,特别是在使用json.loads()解析嵌套JSON或包含反斜杠的字符串时。文章将通过具体示例,阐明…

    2025年12月14日
    000
  • 优雅地终止长时间运行的Asyncio任务:Asyncio.Event的实践指南

    本文深入探讨了在Python asyncio中优雅地终止长时间运行的异步任务的有效方法。针对Task.cancel()方法在某些场景下无法立即停止任务的问题,本文提出并详细阐述了如何利用asyncio.Event机制实现任务的受控停止。通过具体代码示例,读者将学习如何构建响应式、可控的异步任务,确保…

    2025年12月14日
    000
  • 优雅地终止异步任务:asyncio.Event的实践应用

    在asyncio编程中,Task.cancel()方法有时无法按预期停止长时间运行的任务,因为它依赖于任务内部处理CancelledError或在await点检查取消状态。本文将深入探讨Task.cancel()的局限性,并介绍一种更可靠、更优雅的协作式终止机制:使用asyncio.Event。通过…

    2025年12月14日
    000
  • Pandas中条件滚动累加的向量化实现

    本文旨在解决Pandas DataFrame中基于条件和时间窗口进行累加计算的效率问题。通过详细分析迭代方法的局限性,并引入Pandas groupby_rolling函数,展示了如何高效地对指定分组内的历史数据在特定时间窗内进行条件求和。教程提供了示例代码,并强调了数据预处理、排序及窗口定义等关键…

    2025年12月14日
    000
  • asyncio 长运行任务的优雅终止策略:告别 cancel() 的局限性

    本文探讨了 asyncio 中 Task.cancel() 方法在终止长时间运行任务时的局限性,特别是当任务内部循环紧密或不频繁地让出控制权时。我们提出并详细演示了使用 asyncio.Event 实现协作式、优雅的任务终止机制,通过共享事件对象,允许主程序安全地向后台任务发送停止信号,确保任务能够…

    2025年12月14日
    000
  • 如何实现对象的比较操作(__eq__, __lt__等)?

    要实现自定义对象的比较,需定义富比较方法如__eq__、__lt__等,确保类型检查时返回NotImplemented,并通过functools.total_ordering简化代码;若重写__eq__,还需正确实现__hash__以保证对象可哈希,尤其在对象不可变时基于相等属性计算哈希值;对于包含…

    2025年12月14日 好文分享
    000
  • 优雅地停止 asyncio 长运行任务:asyncio.Event 的应用

    asyncio.Task.cancel() 并非总能立即停止长运行任务,尤其当任务不主动处理取消信号时。本文将介绍一种更可靠的机制:利用 asyncio.Event 对象实现异步背景任务的优雅停止。通过让任务定期检查 Event 状态,我们可以在外部发出停止信号,从而确保任务在适当的时机安全退出,避…

    2025年12月14日
    000
  • 如何使用 unittest 或 pytest 进行单元测试?

    unittest和pytest是Python中主流的测试框架,前者是标准库、需继承TestCase类,后者更灵活、支持原生assert;推荐根据项目需求选择,pytest适合大多数场景,而unittest适用于无外部依赖限制的项目。 unittest 和 pytest 都是Python生态中用于编写…

    2025年12月14日
    000
  • 谈谈 Python 的鸭子类型(Duck Typing)和多态

    鸭子类型与多态使Python代码灵活且可扩展,其核心在于对象的行为而非类型,只要对象具有所需方法即可被调用,无需继承特定类或实现接口。这与Java等静态语言依赖显式接口不同,Python在运行时动态检查行为,实现“经验式”多态。这种设计提升代码复用性与扩展性,但也需通过单元测试、文档、类型提示(如P…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信