可变对象与不可变对象在 Python 中的区别

可变对象创建后可修改内容而不改变内存地址,如列表、字典;不可变对象一旦创建内容不可变,任何修改都会生成新对象,如整数、字符串、元组。

可变对象与不可变对象在 python 中的区别

Python中的可变对象和不可变对象,核心区别在于对象创建后其内部状态是否可以被修改。简单来说,如果一个对象在内存中的值(或者说它引用的数据)可以在不改变其内存地址的情况下被改变,那它就是可变的;反之,如果一旦创建就无法修改,任何“修改”操作实际上都是创建了一个新对象,那它就是不可变的。理解这一点,对于写出健壮、高效的Python代码至关重要。

在Python的世界里,我们每天都在和各种对象打交道。这些对象,有些是“易容高手”,可以在原地变身,有些则是“一锤定型”,一旦诞生便无法更改。这种可变性(Mutability)和不可变性(Immutability)的区分,我觉得是Python设计哲学中一个非常精妙且实用的点。

当我们谈论可变对象,比如列表(list)、字典(dict)或集合(set),我的脑海里会浮现出这样一个场景:你有一个背包,里面可以随时添加、删除物品,或者把某个物品换成另一个,而背包本身还是那个背包。这意味着,即使背包里的东西变了,背包这个“实体”在内存中的位置(它的

id

)是不会变的。你可以对它进行

append()

pop()

update()

等操作,这些操作都是在原地修改对象。

而不可变对象,比如整数(int)、浮点数(float)、字符串(str)和元组(tuple),则更像是一张照片。照片一旦冲洗出来,上面的内容就固定了。如果你想“修改”照片,比如在上面加个边框,你实际上是制作了一张新照片,而不是改变了原有的那张。在Python中,当你对一个不可变对象进行“修改”操作时,比如字符串拼接,Python并不会在原字符串的基础上修改,而是会创建一个新的字符串对象,并将结果赋给变量(如果变量被重新赋值的话)。旧的字符串对象如果不再被引用,就会被垃圾回收。这种特性,在我看来,是Python在背后默默为我们做了很多内存管理和优化工作。

立即学习“Python免费学习笔记(深入)”;

Python中哪些是可变对象,哪些是不可变对象?为什么区分它们很重要?

在我日常的编码实践中,识别对象的类型是第一步。Python中常见的不可变对象包括:

数字类型

int

,

float

,

complex

,

bool

字符串

str

元组

tuple

冻结集合

frozenset

字节串

bytes

而常见的可变对象则有:

列表

list

字典

dict

集合

set

字节数组

bytearray

自定义类的实例:通常情况下,如果你不特别处理,自定义类的实例是可变的,因为它们的属性可以被修改。

为什么要区分它们呢?我觉得这不仅仅是理论知识,更是编写健壮、可预测代码的关键。首先,安全性与可预测性。不可变对象一旦创建就不能改变,这意味着它们是“线程安全”的(至少在数据本身层面),并且在多处引用时,你不用担心某个地方的修改会意外影响到其他地方。这大大降低了程序中出现难以追踪的副作用(side effect)的风险。对于可变对象,如果多个变量引用了同一个可变对象,通过其中任何一个变量对对象进行的修改都会反映到所有引用上,这可能导致一些意想不到的行为。

其次,作为字典的键和集合的元素。这是非常实际的一个应用场景。Python要求字典的键和集合的元素必须是可哈希(hashable)的。可哈希的对象必须是不可变的,因为它们的哈希值在生命周期内必须保持不变。如果可变对象(比如列表)可以作为键,那么当列表内容改变时,它的哈希值也会变,这会导致字典无法找到对应的键值对,或者集合无法正确判断元素是否存在。所以,你不能用列表作为字典的键,但可以用元组。

再者,函数参数传递的语义。Python的参数传递是“传对象引用”(pass by object reference)。当一个可变对象作为参数传入函数时,函数内部对这个对象的修改会直接影响到函数外部的原始对象。而传入不可变对象时,函数内部虽然可以对变量进行重新赋值,但这只是让函数内部的局部变量指向了一个新的对象,并不会影响到函数外部的原始对象。理解这一点,能帮助我们避免很多潜在的bug。

可变对象作为函数参数传递时有哪些坑?如何规避?

这是我遇到过很多初学者,甚至是一些有经验的开发者都会踩的坑。当我们将一个可变对象(比如列表或字典)作为函数参数传递时,函数内部对这个对象的任何修改,都会直接影响到函数外部的原始对象。

举个例子:

def add_item_to_list(my_list, item):    my_list.append(item)    print(f"Inside function: {my_list}")my_data = [1, 2, 3]add_item_to_list(my_data, 4)print(f"Outside function: {my_data}")# 预期输出:# Inside function: [1, 2, 3, 4]# Outside function: [1, 2, 3, 4]

可以看到,

my_data

在函数外部也被修改了。这在某些情况下可能是你想要的行为,比如一个函数专门负责更新某个共享配置字典。但更多时候,这种“副作用”会让人头疼,因为它打破了函数的封装性,使得函数变得不那么纯粹和可预测。

更隐蔽的坑是默认参数:

def process_data(data, cache=[]): # 这里的cache是可变对象    cache.append(data)    print(f"Current cache: {cache}")    return cacheprint(process_data(1)) # Current cache: [1]print(process_data(2)) # Current cache: [1, 2]print(process_data(3)) # Current cache: [1, 2, 3]

这里的

cache

列表作为默认参数,只在函数定义时被创建一次。每次调用

process_data

且不传入

cache

时,都会使用同一个列表实例。这显然不是我们通常期望的“每次调用都用一个空的缓存”的行为。

那么,如何规避这些坑呢?

明确意图:如果函数确实需要修改传入的可变对象,那就让这种意图非常明确,比如通过函数命名(

update_config

)或文档字符串来告知使用者。

创建副本:如果函数不应该修改原始对象,那么在函数内部对可变对象进行操作之前,先创建一个副本。对于列表,可以使用切片

my_list[:]

list(my_list)

;对于字典,可以使用

my_dict.copy()

dict(my_dict)

。对于包含可变对象的嵌套结构,可能需要使用

copy.deepcopy()

import copydef add_item_to_list_safe(my_list, item):    temp_list = list(my_list) # 创建一个副本    temp_list.append(item)    print(f"Inside function (modified copy): {temp_list}")    return temp_list # 返回修改后的副本my_data = [1, 2, 3]new_data = add_item_to_list_safe(my_data, 4)print(f"Outside function (original): {my_data}") # [1, 2, 3]print(f"Outside function (new): {new_data}") # [1, 2, 3, 4]

正确使用默认参数:避免使用可变对象作为函数的默认参数。正确的做法是使用

None

作为默认值,然后在函数内部检查并创建新的可变对象。

def process_data_fixed(data, cache=None):    if cache is None:        cache = [] # 每次调用都会创建一个新的空列表    cache.append(data)    print(f"Current cache: {cache}")    return cacheprint(process_data_fixed(1)) # Current cache: [1]print(process_data_fixed(2)) # Current cache: [2]print(process_data_fixed(3)) # Current cache: [3]

不可变对象在Python设计哲学中扮演了什么角色?如何判断一个Python对象是可变还是不可变?

不可变对象在Python的设计哲学中扮演着一个非常重要的角色,我觉得它体现了Python对清晰性、可预测性和稳健性的追求。虽然Python不是一个纯粹的函数式编程语言,但不可变对象的存在,无疑为我们提供了编写更接近函数式风格代码的可能性。这使得函数更容易理解和测试,因为它们不会产生意外的副作用。在某些场景下,比如哈希表的实现(字典键、集合元素),不可变性更是其工作原理的基石。此外,不可变对象可以更容易地被缓存和共享,这对于性能优化也有潜在的好处。

那么,如何判断一个Python对象是可变还是不可变呢?这其实有几个方法可以尝试:

尝试原地修改:这是最直观的方法。如果你能找到一个方法(比如

append()

extend()

__setitem__

等)在不改变对象

id()

的情况下修改其内容,那么它就是可变的。如果所有“修改”操作都返回了一个新对象,而原始对象的

id()

和内容都没有变,那么它就是不可变的。

my_list = [1, 2]print(f"List ID before: {id(my_list)}")my_list.append(3) # 原地修改print(f"List ID after append: {id(my_list)}") # ID不变print(f"List content: {my_list}") # [1, 2, 3]my_string = "hello"print(f"String ID before: {id(my_string)}")my_string += " world" # 实际上是创建了新字符串print(f"String ID after concat: {id(my_string)}") # ID改变了print(f"String content: {my_string}") # "hello world"

使用

hash()

函数:如果一个对象是可哈希的(hashable),那么它通常是不可变的。因为可哈希意味着它的哈希值在生命周期内是固定的,而只有不可变对象才能保证这一点。你可以尝试对对象调用内置的

hash()

函数。如果成功返回一个整数,那么它就是可哈希的,也基本可以认为是不可变的。如果抛出

TypeError

,那么它就是不可哈希的,通常是可变对象。

print(hash(10))        # 整数,可哈希print(hash("python"))  # 字符串,可哈希print(hash((1, 2)))    # 元组,可哈希try:    hash([1, 2])       # 列表,不可哈希,会抛出TypeErrorexcept TypeError as e:    print(f"Error hashing list: {e}")try:    hash({'a': 1})     # 字典,不可哈希,会抛出TypeErrorexcept TypeError as e:    print(f"Error hashing dict: {e}")

需要注意的是,并非所有不可哈希的对象都是可变的(例如,自定义类实例默认是可变的,但你可以通过实现

__hash__

__eq__

使其变得可哈希),但对于Python的内置类型,这个规则是相当可靠的。

查阅官方文档:最权威、最准确的方法,当然是查阅Python的官方文档。文档会明确指出每种内置类型是可变的还是不可变的。

理解可变性与不可变性,不仅仅是掌握了Python的一个语言特性,更是深入理解Python内存管理、对象生命周期和程序行为的关键。它能帮助我们更好地设计数据结构,编写出更安全、更高效、更易于维护的代码。

以上就是可变对象与不可变对象在 Python 中的区别的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1369716.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 09:54:14
下一篇 2025年12月14日 09:54:28

相关推荐

  • Python字典的底层实现原理是什么?

    Python字典通过哈希表实现O(1)平均时间复杂度,其核心在于哈希函数、开放寻址冲突解决和动态扩容机制。 Python字典的底层实现核心在于其哈希表(Hash Table)的实现。它通过将键(Key)映射到一个存储位置来快速存取值(Value),这使得大多数操作都能保持接近常数时间复杂度,也就是我…

    好文分享 2025年12月14日
    000
  • Python中的*args和**kwargs有什么作用和区别?

    args和kwargs用于增强函数灵活性,args收集位置参数为元组,kwargs收集关键字参数为字典,二者在函数定义中收集参数,在调用时可解包传递,适用于可变参数场景。 *args 和 **kwargs 是Python中两个非常强大的语法糖,它们允许函数接受可变数量的参数。简单来说, *args …

    2025年12月14日
    000
  • 如何使用Python发送HTTP请求(requests库)?

    答案:使用requests库可简洁发送HTTP请求。通过get()、post()等方法发送请求,配合params、headers、json等参数传递数据,利用raise_for_status()处理错误,使用Session保持会话、复用连接,提升效率与代码可读性。 Python中发送HTTP请求,最…

    2025年12月14日
    000
  • 如何反转一个字符串?

    反转字符串的核心是将字符顺序倒置,常用方法包括语言内置函数(如Python切片、JavaScript的split-reverse-join)、手动循环和递归。内置方法最简洁高效,时间复杂度O(n),推荐优先使用;手动循环适用于需精细控制的场景;递归虽优雅但有栈溢出风险,慎用于长字符串。实际应用包括回…

    2025年12月14日
    000
  • 使用 Matplotlib 和 Seaborn 进行数据可视化

    Matplotlib 提供精细控制,Seaborn 简化统计绘图,两者结合可高效实现数据可视化:先用 Seaborn 快速探索数据,再用 Matplotlib 调整细节与布局,实现美观与功能的统一。 在使用 Python 进行数据可视化时,Matplotlib 和 Seaborn 无疑是两把利器。它…

    2025年12月14日
    000
  • Python中处理包含转义字符的JSON字符串:深入理解原始字符串与F-字符串

    本文深入探讨了在Python中处理包含转义字符的JSON字符串时,原始字符串(r前缀)和F-字符串(f前缀)的使用误区与正确实践。核心问题在于Python字符串字面量解析与JSON转义规则之间的差异,特别是在使用json.loads()解析嵌套JSON或包含反斜杠的字符串时。文章将通过具体示例,阐明…

    2025年12月14日
    000
  • 优雅地终止长时间运行的Asyncio任务:Asyncio.Event的实践指南

    本文深入探讨了在Python asyncio中优雅地终止长时间运行的异步任务的有效方法。针对Task.cancel()方法在某些场景下无法立即停止任务的问题,本文提出并详细阐述了如何利用asyncio.Event机制实现任务的受控停止。通过具体代码示例,读者将学习如何构建响应式、可控的异步任务,确保…

    2025年12月14日
    000
  • Pandas中条件滚动累加的向量化实现

    本文旨在解决Pandas DataFrame中基于条件和时间窗口进行累加计算的效率问题。通过详细分析迭代方法的局限性,并引入Pandas groupby_rolling函数,展示了如何高效地对指定分组内的历史数据在特定时间窗内进行条件求和。教程提供了示例代码,并强调了数据预处理、排序及窗口定义等关键…

    2025年12月14日
    000
  • 如何实现对象的比较操作(__eq__, __lt__等)?

    要实现自定义对象的比较,需定义富比较方法如__eq__、__lt__等,确保类型检查时返回NotImplemented,并通过functools.total_ordering简化代码;若重写__eq__,还需正确实现__hash__以保证对象可哈希,尤其在对象不可变时基于相等属性计算哈希值;对于包含…

    2025年12月14日 好文分享
    000
  • 如何使用 unittest 或 pytest 进行单元测试?

    unittest和pytest是Python中主流的测试框架,前者是标准库、需继承TestCase类,后者更灵活、支持原生assert;推荐根据项目需求选择,pytest适合大多数场景,而unittest适用于无外部依赖限制的项目。 unittest 和 pytest 都是Python生态中用于编写…

    2025年12月14日
    000
  • 谈谈 Python 的鸭子类型(Duck Typing)和多态

    鸭子类型与多态使Python代码灵活且可扩展,其核心在于对象的行为而非类型,只要对象具有所需方法即可被调用,无需继承特定类或实现接口。这与Java等静态语言依赖显式接口不同,Python在运行时动态检查行为,实现“经验式”多态。这种设计提升代码复用性与扩展性,但也需通过单元测试、文档、类型提示(如P…

    2025年12月14日
    000
  • 详解 Python 的垃圾回收机制:引用计数与分代回收

    Python的垃圾回收机制主要通过引用计数和分代回收协同工作。引用计数即时回收无引用对象,实现高效内存管理,但无法处理循环引用;分代回收则通过将对象按存活时间分为三代,定期检测并清除循环引用,弥补引用计数的不足。两者结合,既保证了内存释放的及时性,又解决了复杂场景下的内存泄露问题,构成了Python…

    2025年12月14日
    000
  • 解决Docker中Uvicorn/FastAPI连接拒绝问题的实用指南

    本文旨在解决Uvicorn/FastAPI应用在Docker容器中运行时,宿主机无法连接的常见“连接拒绝”错误。核心问题在于Docker容器的端口未正确映射到宿主机。我们将详细探讨Uvicorn配置、Dockerfile设置以及关键的Docker端口映射命令,提供清晰的步骤和示例,确保您的FastA…

    2025年12月14日
    000
  • 通过requirements.txt文件为pip安装传递构建配置

    本文将指导您如何在Python项目的requirements.txt文件中,利用pip install命令的–config-settings选项,为特定包传递构建时配置或环境变量。这对于需要特殊编译参数的包(如在安装ctransformers时启用CT_METAL)至关重要,确保安装过程…

    2025年12月14日
    000
  • 类变量和实例变量有什么区别?

    类变量属于类本身,被所有实例共享,修改会影响全部实例;实例变量属于每个实例,独立存在,互不影响。类变量适用于共享数据如常量、计数器,实例变量用于对象独有属性如姓名、状态。可变类变量易引发意外共享,继承中子类可遮蔽父类类变量,而实例变量通过super()继承并保持独立。 类变量和实例变量的核心区别在于…

    2025年12月14日
    000
  • Pandas DataFrame列中基于条件删除字符串特定部分的教程

    本教程详细讲解如何在Pandas DataFrame的字符串列中,根据特定条件(例如分隔符数量)删除字符串中指定位置后的内容。文章通过实际案例,演示了如何利用map函数结合lambda表达式和字符串方法,高效且灵活地处理数据,并讨论了不同场景下的策略选择。 1. 问题描述与挑战 在数据清洗和预处理过…

    2025年12月14日
    000
  • 如何从任务生成器创建异步任务执行机制

    本文介绍了如何利用Python的asyncio库,结合任务生成器,实现异步任务的执行。重点在于避免使用await直接等待任务完成,而是通过create_task创建任务并将其添加到事件循环中,并通过asyncio.sleep(0)或TaskGroup等机制,确保事件循环能够调度其他任务,从而实现真正…

    2025年12月14日
    000
  • 使用TaskGroup实现异步任务生成器的任务执行

    本文介绍了如何使用异步任务生成器和 asyncio 库在 Python 中实现异步任务执行。核心思想是利用 asyncio.TaskGroup (Python 3.11+) 创建任务组,并使用 create_task 方法将生成器产生的任务添加到任务组中,同时通过 await asyncio.sle…

    2025年12月14日
    000
  • Python asyncio:从任务生成器实现高效异步并发执行的原理与实践

    本教程深入探讨如何在Python asyncio中,从任务生成器实现异步任务的无阻塞并发执行。针对在不 await 任务完成的情况下,持续创建并调度新任务的需求,文章详细阐述了 asyncio 协程协作的本质,并提供了两种核心解决方案:通过 await asyncio.sleep(0) 显式让出控制…

    2025年12月14日
    000
  • 将包含CST时区的字符串转换为datetime对象

    本文介绍如何将包含CST(中国标准时间)时区信息的字符串转换为Python的datetime对象。通过使用pandas库的to_datetime()函数,并结合时区映射,可以有效地处理这类时间字符串的转换,从而方便后续的时间操作和分析。 在处理时间数据时,经常会遇到包含时区信息的字符串。例如,&#8…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信