Python中的可变对象和不可变对象有哪些?区别是什么?

Python中对象分为可变和不可变两类,区别在于创建后能否修改其内容。可变对象(如列表、字典、集合)允许原地修改,内存地址不变;不可变对象(如整数、字符串、元组)一旦创建内容不可更改,任何“修改”实际是创建新对象。这种机制影响函数参数传递、哈希性、并发安全和性能优化。例如,不可变对象可作为字典键,因具有固定哈希值;而可变对象则不能。判断可变性可通过尝试修改并观察id()是否变化,或使用hash()检查是否可哈希。理解此差异有助于避免副作用和潜在bug,提升代码可预测性与健壮性。

python中的可变对象和不可变对象有哪些?区别是什么?

Python中的对象大致可以分为两类:可变对象和不可变对象。核心区别在于,可变对象在创建后其内部状态可以被修改,而不可变对象一旦创建,其值就不能再改变。如果看起来它们“变”了,那通常是创建了一个新的对象。理解这一点,对于写出健壮、可预测的Python代码至关重要。

解决方案

在Python的世界里,对象的“可变性”(mutability)和“不可变性”(immutability)是理解其工作机制的关键概念。简单来说,一个可变对象就像一块橡皮泥,你可以随意捏扁搓圆,改变它的形状,但它依然是那块橡皮泥,内存地址不变。而不可变对象则更像是一块雕塑,一旦完成,你就不能再改变它。任何对它的“修改”操作,实际上都是在旁边重新雕刻了一块新的雕塑。

这种设计哲学渗透在Python的方方面面。比如,当你有一个列表(list),你可以直接在原地添加元素、删除元素,甚至修改特定位置的值,这些操作都不会改变列表本身的内存地址。但如果你有一个字符串(string),尝试修改它的某个字符,Python会直接报错,因为字符串是不可变的。所有看似修改字符串的操作,比如字符串拼接,实际上都是创建了一个全新的字符串对象。

这种区分带来的影响非常深远,尤其是在函数参数传递、多线程编程(虽然Python的GIL在一定程度上简化了并发数据修改的问题,但理解可变性依然重要)、以及作为字典键或集合元素时。我个人觉得,很多初学者在遇到意料之外的行为时,往往就是因为没有搞清楚对象的可变性。

立即学习“Python免费学习笔记(深入)”;

Python中常见的可变对象类型有哪些?

谈到可变对象,我们最常打交道的莫过于列表(

list

)、字典(

dict

)和集合(

set

)了。它们是Python数据结构中的主力军,也是我们日常编程中修改频率最高的几种。

列表(

list

)是我觉得最直观的可变对象。你可以直接在原地增删改查。比如,

my_list = [1, 2, 3]

,然后

my_list.append(4)

,你会发现

my_list

变成了

[1, 2, 3, 4]

,而

id(my_list)

并没有变。这种“原地修改”的特性让列表在处理动态数据集时非常高效。

my_list = [1, 2, 3]print(f"原始列表: {my_list}, ID: {id(my_list)}")my_list.append(4) # 在原地修改print(f"添加元素后: {my_list}, ID: {id(my_list)}")my_list[0] = 10 # 修改第一个元素print(f"修改元素后: {my_list}, ID: {id(my_list)}")

字典(

dict

)也一样,它是键值对的集合。你可以随时添加新的键值对,修改现有键对应的值,或者删除键值对,而字典对象本身依然是那个字典。

my_dict = {'a': 1, 'b': 2}print(f"原始字典: {my_dict}, ID: {id(my_dict)}")my_dict['c'] = 3 # 添加新键值对print(f"添加元素后: {my_dict}, ID: {id(my_dict)}")my_dict['a'] = 10 # 修改值print(f"修改值后: {my_dict}, ID: {id(my_dict)}")

集合(

set

)是无序不重复元素的集合,它也支持添加和删除元素的操作。

my_set = {1, 2, 3}print(f"原始集合: {my_set}, ID: {id(my_set)}")my_set.add(4) # 添加元素print(f"添加元素后: {my_set}, ID: {id(my_set)}")my_set.remove(1) # 删除元素print(f"删除元素后: {my_set}, ID: {id(my_set)}")

此外,像

bytearray

也是可变类型。自定义的类实例,除非你特别设计成不可变,否则它们通常也是可变的,因为你可以随时修改它们的属性。理解这些,在构建复杂数据结构时,能避免很多坑。

Python中常见的不可变对象类型有哪些?

与可变对象相对,不可变对象一旦创建,其值就无法改变。这听起来可能有点限制,但实际上,这种特性带来了稳定性和可预测性。最典型的不可变对象包括数字(

int

,

float

,

complex

)、字符串(

str

)、元组(

tuple

)和冻结集合(

frozenset

)。

数字类型,例如整数和浮点数,是不可变的。当你写

x = 5

,然后

x = x + 1

时,你并不是改变了

5

这个值本身,而是创建了一个新的整数对象

6

,然后让变量

x

指向了它。

x = 5print(f"原始整数: {x}, ID: {id(x)}")x = x + 1 # 实际上是创建了一个新的整数对象 6print(f"加1后: {x}, ID: {id(x)}") # ID会改变

字符串(

str

)是另一个非常重要的不可变类型。在我看来,字符串的不可变性是Python设计中一个非常优雅的地方。它使得字符串操作更安全,尤其是在多线程环境下,你不用担心某个线程意外修改了另一个线程正在使用的字符串。当你进行字符串拼接时,比如

s = "hello" + " world"

,实际上是创建了一个新的字符串

"hello world"

s = "hello"print(f"原始字符串: {s}, ID: {id(s)}")s += " world" # 实际上是创建了一个新的字符串对象print(f"拼接后: {s}, ID: {id(s)}") # ID会改变

元组(

tuple

)是不可变序列。一旦创建,你不能添加、删除或修改其内部元素。如果元组中包含可变对象,比如一个列表,那么这个列表本身还是可以被修改的,但元组中指向这个列表的引用是不可变的。这有点像一个只读的指针,指向的内容可以变,但指针本身不能指向别的地方。

my_tuple = (1, 2, [3, 4])print(f"原始元组: {my_tuple}, ID: {id(my_tuple)}")# my_tuple[0] = 10 # 这会报错,因为元组不可变# print(f"尝试修改元素: {my_tuple}, ID: {id(my_tuple)}")my_tuple[2].append(5) # 元组中的列表是可变的,所以可以修改print(f"修改元组内列表后: {my_tuple}, ID: {id(my_tuple)}") # 元组ID不变

冻结集合(

frozenset

)是不可变的集合版本,可以作为字典的键。字节串(

bytes

)也是不可变的。理解这些,有助于我们更好地选择数据结构,并预测代码的行为。

为什么Python要区分可变与不可变对象?

Python区分可变与不可变对象,绝不是为了增加复杂性,而是出于多方面的设计考量,这些考量最终提升了语言的实用性、安全性和性能。我个人认为,这体现了Python在灵活性和健壮性之间寻求平衡的智慧。

首先,哈希性(Hashability) 是一个非常重要的原因。不可变对象通常是“可哈希的”(hashable),这意味着它们有一个固定的哈希值,这个哈希值在对象的生命周期内不会改变。这使得不可变对象能够被用作字典的键(

dict

keys)和集合的元素(

set

elements)。想象一下,如果一个字典的键是可变的,那么键的值改变了,它在哈希表中的位置也会变,这会彻底破坏字典的查找机制。而可变对象(如列表、字典)因为其内容可能变化,所以默认是不可哈希的,不能直接作为字典键或集合元素。

其次,数据完整性和安全性。不可变对象一旦创建就不能被修改,这在很多场景下非常有用。比如,当你将一个不可变对象传递给函数时,你可以确信函数不会意外地修改原始对象。这减少了副作用(side effects)的发生,使得代码更容易理解和调试。在并发编程中,虽然Python的GIL(全局解释器锁)限制了多线程的并行执行,但在多进程或异步编程中,不可变数据结构能有效避免竞态条件(race conditions),因为它们本身就是线程安全的。

再者,性能优化。Python解释器可以对不可变对象进行一些内部优化。例如,对于小整数(-5到256)和某些短字符串,Python会进行“interning”(驻留),即在内存中只保留一份副本。当你创建多个相同值的不可变对象时,它们可能都指向内存中的同一个对象,这节省了内存。

a = 1b = 1print(id(a) == id(b)) # True,因为小整数被驻留s1 = "hello"s2 = "hello"print(id(s1) == id(s2)) # True,短字符串也被驻留l1 = [1, 2]l2 = [1, 2]print(id(l1) == id(l2)) # False,列表是可变的,即使内容相同也是不同对象

最后,函数式编程范式。不可变性是函数式编程的核心原则之一。它鼓励我们编写没有副作用的函数,即函数只接收输入,产生输出,而不修改任何外部状态。这使得代码更模块化,更容易测试和组合。虽然Python不是纯粹的函数式语言,但不可变对象的存在,无疑为追求这种风格的开发者提供了便利。

在我看来,这种区分是Python设计哲学的一个缩影:提供强大的工具,同时也要求开发者理解这些工具的特性,以便更好地驾驭它们。忽略可变性与不可变性的差异,可能会导致一些难以追踪的bug,比如在默认参数中使用可变对象。

如何判断一个对象是可变还是不可变?

在Python中,判断一个对象是可变还是不可变,通常有几种方法,有些是经验性的,有些则是通过内置函数进行验证。这不是一个“一刀切”的检查,更像是结合对Python数据类型的理解和一些小技巧。

最直接的方法,也是我个人最常用的,就是尝试修改它。如果你能成功地在原地修改对象的内容,并且

id()

函数返回的内存地址保持不变,那么它就是可变的。

my_list = [1, 2]print(f"修改前ID: {id(my_list)}")my_list.append(3)print(f"修改后ID: {id(my_list)}") # ID通常不变,列表可变

如果尝试修改会抛出错误(比如

TypeError: 'str' object does not support item assignment

),或者修改操作实际上是返回了一个新对象(导致

id()

发生变化),那么它就是不可变的。

my_string = "hello"print(f"修改前ID: {id(my_string)}")# my_string[0] = 'H' # 这会报错my_string = my_string + " world" # 这会创建新对象print(f"修改后ID: {id(my_string)}") # ID会变,字符串不可变

另一个非常重要的判断依据是哈希性(Hashability)。可哈希的对象通常是不可变的。你可以使用内置的

hash()

函数来检查一个对象是否可哈希。如果

hash()

函数能成功返回一个整数值,那么这个对象就是可哈希的,通常意味着它是不可变的(自定义类可以通过实现

__hash__

__eq__

方法来变得可哈希)。如果

hash()

抛出

TypeError

,那么这个对象就是不可哈希的,通常是可变的。

print(f"整数1的哈希值: {hash(1)}") # 可哈希print(f"字符串'abc'的哈希值: {hash('abc')}") # 可哈希print(f"元组(1, 2)的哈希值: {hash((1, 2))}") # 可哈希try:    hash([1, 2])except TypeError as e:    print(f"列表不可哈希: {e}") # 列表不可哈希try:    hash({'a': 1})except TypeError as e:    print(f"字典不可哈希: {e}") # 字典不可哈希

最后,查阅Python文档或经验。对于内置类型,记住哪些是可变、哪些是不可变,是最直接有效的方法。比如:

不可变:

int

,

float

,

complex

,

str

,

tuple

,

frozenset

,

bytes

可变:

list

,

dict

,

set

,

bytearray

对于自定义对象,它们默认是可变的,除非你特意通过一些技巧(比如使用

__slots__

并避免设置可变属性)来使其行为更像不可变对象。理解这些判断方法,能帮助我们更好地预测代码行为,并避免一些常见的陷阱。

以上就是Python中的可变对象和不可变对象有哪些?区别是什么?的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1370338.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 10:27:27
下一篇 2025年12月14日 10:27:52

相关推荐

  • 多输出回归模型RMSE计算的精确指南

    本文详细探讨了在多输出回归模型中,使用scikit-learn计算均方根误差(RMSE)的两种常见方法:直接调用mean_squared_error(squared=False)和手动计算sqrt(mean_squared_error(squared=True))。通过实例代码,我们确认了这两种方法…

    2025年12月14日
    000
  • Web 框架:Django 和 Flask 的对比与选型

    Djan%ignore_a_1% 和 Flask,选哪个?简单来说,Django 适合大型项目,自带全家桶;Flask 适合小型项目,灵活自由。 Django 和 Flask 都是非常流行的 Python Web 框架,但它们的设计哲学和适用场景有所不同。选择哪个框架,取决于你的项目需求、团队技能和…

    2025年12月14日
    000
  • GIL(全局解释器锁)是什么?它对多线程有什么影响?

    GIL是CPython解释器中的互斥锁,确保同一时刻仅一个线程执行Python字节码,导致多线程在CPU密集型任务中无法并行。其存在简化了内存管理,但限制了多核性能利用。I/O密集型任务受影响较小,因线程在等待时会释放GIL。解决方案包括:1. 使用多进程实现真正并行;2. 利用C扩展在C代码中释放…

    2025年12月14日
    000
  • 如何理解Python的并发与并行?

    答案:Python中并发指任务交错执行,看似同时运行,而并行指任务真正同时执行;由于GIL限制,多线程无法实现CPU并行,仅适用于I/O密集型任务,而真正的并行需依赖multiprocessing或多核支持的底层库。 理解Python的并发与并行,核心在于区分“看起来同时进行”和“实际同时进行”。并…

    2025年12月14日
    000
  • 用户认证与授权:JWT 令牌的工作原理

    JWT通过数字签名实现无状态认证,由Header、Payload、Signature三部分组成,支持跨系统认证;其安全性依赖强密钥、HTTPS传输、短过期时间及敏感信息不存储于载荷,常见风险包括令牌泄露、弱密钥和算法混淆;相比传统Session的有状态管理,JWT无需服务端存储会话,适合分布式架构,…

    2025年12月14日
    000
  • Python 中的模块(Module)和包(Package)管理

    Python的模块和包是代码组织与复用的核心,模块为.py文件,包为含__init__.py的目录,通过import导入,结合虚拟环境(如venv)可解决依赖冲突,实现项目隔离;合理结构(如my_project/下的包、测试、脚本分离)提升可维护性,使用pyproject.toml或setup.py…

    2025年12月14日
    000
  • Scikit-learn中多输出回归模型RMSE的正确计算与精度考量

    本文深入探讨了在多输出回归模型中计算均方根误差(RMSE)的两种常见方法:直接使用sklearn.metrics.mean_squared_error(squared=False)和结合math.sqrt与mean_squared_error(squared=True)。文章通过理论分析和代码示例验…

    2025年12月14日
    000
  • 使用 tabula-py 精准提取 PDF 表格数据的实战指南

    本文详细介绍了如何利用 tabula-py 库从 PDF 文件中高效、精准地提取表格数据。教程从基础用法入手,逐步深入到通过 lattice 参数优化表格结构,并结合 pandas 进行数据后处理,以解决常见的冗余列问题,最终实现高质量的表格数据抽取。 1. tabula-py 简介与基础用法 ta…

    2025年12月14日
    000
  • 谈谈你对 Python 设计模式的理解,如单例模式

    Python设计模式,说白了,就是针对特定场景,前辈们总结出来的代码组织和编写的套路。理解它们,能让你的代码更优雅、可维护,也更容易被别人理解。单例模式只是其中一种,目的是确保一个类只有一个实例,并提供一个全局访问点。 解决方案 单例模式在Python中的实现方式有很多种,最常见的是使用 __new…

    2025年12月14日
    000
  • Python中的元类(Metaclass)有什么作用?

    元类是创建类的工厂,它通过拦截类的创建过程实现对类结构、属性和方法的动态修改,常用于自动注册、验证类结构、实现单例模式等高级场景,其核心在于提供类创建的钩子机制,本质是类的类,由type默认充当,自定义元类需谨慎以避免复杂性和维护难题。 Python中的元类(Metaclass)本质上是创建类的“工…

    2025年12月14日
    000
  • 掌握tabula-py:精准提取PDF表格数据

    本文详细介绍了如何使用Python库tabula-py从PDF文件中高效且准确地提取表格数据。我们将探讨在面对复杂表格布局时,如何通过调整lattice参数来优化提取效果,并进一步讲解如何处理提取过程中可能出现的冗余“Unnamed”列,从而获得干净、结构化的数据。教程涵盖了从基础使用到高级优化的全…

    2025年12月14日
    000
  • 如何用Python进行图像处理(PIL/Pillow)?

    Pillow因其历史悠久、API直观、性能良好且与Python生态融合度高,成为Python%ignore_a_1%首选库;它广泛应用于Web图片处理、数据增强、动态图像生成等场景,支持缩放、裁剪、旋转、滤镜、合成和文字添加等操作;对于大图像或复杂计算,可结合NumPy或选用OpenCV、Sciki…

    2025年12月14日
    000
  • 如何使用NumPy进行数组计算?

    NumPy通过提供高性能的多维数组对象和丰富的数学函数,简化了Python中的数值计算。它支持高效的数组创建、基本算术运算、矩阵乘法、通用函数及聚合操作,并具备优于Python列表的同质性、连续内存存储和底层C实现带来的性能优势。其强大的索引、切片、形状操作和广播机制进一步提升了数据处理效率,使Nu…

    2025年12月14日
    000
  • Python Tabula 库高级用法:实现 PDF 表格的精确提取与清洗

    本教程详细介绍了如何使用 Python 的 Tabula 库从 PDF 文件中高效、准确地提取表格数据。我们将从基础用法开始,逐步深入到利用 lattice=True 参数优化提取精度,并提供数据后处理策略以清除提取过程中可能产生的冗余列,最终实现干净、结构化的表格数据输出。 1. 介绍 Tabul…

    2025年12月14日
    000
  • 什么是PEP 8?你平时如何遵守代码规范?

    PEP 8 的核心原则是可读性优先、一致性与显式优于隐式,它通过命名规范、代码格式等提升代码质量;在实践中可通过 Black、isort 等工具自动化执行,并结合团队协作与代码审查落地;此外,Google 风格指南、文档字符串规范及框架特定惯例也值得遵循。 PEP 8 是 Python 官方推荐的风…

    2025年12月14日
    000
  • 如何构建一个异步的 Web 服务(FastAPI)?

    构建异步Web服务需掌握asyncio、选用适配数据库的异步驱动(如PostgreSQL用asyncpg、MongoDB用motor),并利用FastAPI的依赖注入实现全局异常处理,结合pytest-asyncio和httpx编写覆盖各类场景的异步测试。 构建异步 Web 服务,核心在于提高并发处…

    2025年12月14日
    000
  • 协程(Coroutine)与 asyncio 库在 IO 密集型任务中的应用

    协程通过asyncio实现单线程内高效并发,利用事件循环在IO等待时切换任务,避免线程开销,提升资源利用率与并发性能。 协程(Coroutine)与 Python 的 asyncio 库在处理 IO 密集型任务时,提供了一种极其高效且优雅的并发解决方案。它允许程序在等待外部操作(如网络请求、文件读写…

    2025年12月14日
    000
  • 解决TensorFlow _pywrap_tf2 DLL加载失败错误

    本文旨在解决TensorFlow中遇到的ImportError: DLL load failed while importing _pywrap_tf2错误,该错误通常由动态链接库初始化失败引起。核心解决方案是通过卸载现有TensorFlow版本并重新安装一个已知的稳定版本(如2.12.0),以确保…

    2025年12月14日
    000
  • 解释一下Python的MRO(方法解析顺序)。

    Python的MRO通过C3线性化算法确定多重继承中方法的查找顺序,解决菱形继承问题,确保调用的确定性与一致性,避免歧义,并为super()提供调用链依据,使类间的协作式继承得以实现。 Python的MRO,也就是方法解析顺序,说白了,就是Python在处理类继承,特别是当一个类从多个父类那里继承东…

    2025年12月14日
    000
  • 如何获取一个对象的所有属性和方法?

    答案:获取对象所有属性和方法需结合Reflect.ownKeys()和for…in。Reflect.ownKeys()返回对象自身所有键(包括字符串和Symbol,可枚举与不可枚举),而for…in可遍历原型链上的可枚举属性,配合hasOwnProperty()可区分自身与继…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信