Python怎么创建一个集合（set）_Python集合创建与使用详解

程序猿 • 2025年12月14日 12:13:37 • 用户投稿 • 阅读 0

创建集合推荐使用set()构造函数，因{}会创建字典；集合具唯一性、无序性、元素需不可变，适用于去重、成员检测及集合运算。

在Python中，创建一个集合（set）主要有两种方式：使用花括号

{}

直接定义，或者通过

set()

构造函数。这两种方法各有侧重，理解它们的区别是高效使用集合的关键。

解决方案

要创建一个Python集合，最直观的方式是使用花括号

{}

，并将元素用逗号分隔。但这里有个小陷阱，如果你想创建一个空集合，

{}

实际上会创建一个空字典，而不是空集合。正确的空集合创建方式是使用

set()

构造函数。

举个例子：

# 方法一：使用花括号 {} 创建非空集合my_set = {1, 2, 3, 'apple', 'banana'}print(f"通过花括号创建的集合: {my_set}")print(f"类型: {type(my_set)}")# 错误示范：创建一个空字典，而非空集合empty_dict = {}print(f"通过花括号创建的空集合（实际是字典）: {empty_dict}")print(f"类型: {type(empty_dict)}")# 方法二：使用 set() 构造函数创建集合# 创建空集合empty_set = set()print(f"通过 set() 创建的空集合: {empty_set}")print(f"类型: {type(empty_set)}")# 从列表创建集合（会自动去重）list_data = [1, 2, 2, 3, 'apple', 'apple', 'orange']set_from_list = set(list_data)print(f"从列表创建的集合: {set_from_list}")# 从元组创建集合tuple_data = (10, 20, 20, 30)set_from_tuple = set(tuple_data)print(f"从元组创建的集合: {set_from_tuple}")# 从字符串创建集合（会把每个字符作为一个元素，并去重）string_data = "hello"set_from_string = set(string_data)print(f"从字符串创建的集合: {set_from_string}") # 结果可能是 {'o', 'l', 'e', 'h'}，顺序不确定

可以看到，

set()

构造函数非常灵活，可以接受任何可迭代对象（如列表、元组、字符串、range对象等）作为参数，并将其中的元素转换为集合的元素。这个过程中，它会自动处理重复项，确保集合中每个元素都是唯一的。

立即学习“Python免费学习笔记（深入）”；

Python集合有哪些核心特性和应用场景？

集合（set）在Python中是一个非常独特的数据结构，它不像列表或元组那样简单。我个人觉得，理解它的核心特性，是掌握它强大之处的关键。

首先，也是最重要的一个特性，就是元素唯一性。集合会自动排除重复的元素。当你需要处理一个数据集，并且只关心其中不重复的值时，集合简直是“神器”。比如，我以前在处理用户ID日志时，经常会遇到大量重复的ID，如果想快速统计有多少独立用户，把所有ID扔进一个集合，瞬间就能得到结果，效率比循环判断快得多。

其次，集合是无序的。这意味着你不能通过索引来访问集合中的元素，比如

my_set[0]

这种操作是不被允许的。集合内部的存储方式决定了它不关心元素的排列顺序，这有时会让初学者感到困惑，但正是这种无序性，使得集合在查找、插入和删除操作上表现出惊人的效率（通常是O(1)的平均时间复杂度）。

再者，集合中的元素必须是不可变对象。你可以把数字、字符串、元组放进集合，但不能直接把列表、字典或另一个集合放进去，因为它们是可变的。如果你尝试这样做，Python会报错。这个限制其实是为了保证集合内部哈希（hash）机制的正常运作，确保元素的唯一性和快速查找。当然，如果你非要存一个可变对象，可以考虑将可变对象转换为不可变形式（比如将列表转换为元组），但这通常意味着你可能需要重新审视你的数据结构设计。

至于应用场景，那真是五花八门：

去重：这是最常见的用途，无论数据来自文件、数据库还是网络，集合都能高效完成。成员资格测试：判断一个元素是否在集合中，速度极快。比如，检查一个单词是否在某个词汇表中，比遍历列表要快得多。数学集合操作：并集、交集、差集、对称差集，这些在数据分析和算法中非常有用。比如，找出两个用户群体的共同偏好（交集），或者找出某个群体独有的特征（差集）。消除冗余数据：在处理配置项、权限列表等场景时，集合能确保每个项都是唯一的。

我曾经用集合来优化一个推荐系统的数据预处理环节，通过集合的快速去重和交集操作，显著提升了数据清洗的效率，这比我最初用循环和条件判断要简洁和高效得多。

除了创建，我们还能对Python集合进行哪些常用操作？

创建集合只是第一步，真正让集合发挥作用的是它提供的各种操作方法。这些方法让我们可以方便地处理集合间的关系，以及对集合内部元素进行增删改查。

# 示例集合set1 = {1, 2, 3, 4, 5}set2 = {4, 5, 6, 7, 8}set3 = {1, 2}print(f"原始集合1: {set1}")print(f"原始集合2: {set2}")print(f"原始集合3: {set3}n")# 1. 添加元素# add() 方法用于添加单个元素set1.add(6)set1.add(1) # 添加已存在的元素不会有任何效果print(f"添加元素后的集合1: {set1}") # 结果是 {1, 2, 3, 4, 5, 6}# update() 方法用于添加多个元素（可以是列表、元组、另一个集合等）set1.update([7, 8], {9, 10})print(f"更新元素后的集合1: {set1}n") # 结果是 {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}# 2. 删除元素# remove() 方法：删除指定元素，如果元素不存在会报错 KeyErrortry:    set1.remove(10)    print(f"删除元素10后的集合1: {set1}")    # set1.remove(100) # 尝试删除不存在的元素会报错except KeyError:    print("尝试删除不存在的元素引发了 KeyErrorn")# discard() 方法：删除指定元素，如果元素不存在不会报错set1.discard(9)set1.discard(100) # 删除不存在的元素不会报错print(f"删除元素9后的集合1: {set1}")# pop() 方法：随机删除并返回一个元素，空集合调用会报错 KeyErrortry:    popped_element = set1.pop()    print(f"弹出的元素: {popped_element}, 剩余集合1: {set1}")except KeyError:    print("尝试从空集合弹出元素引发了 KeyErrorn")# clear() 方法：清空集合temp_set = {1, 2, 3}temp_set.clear()print(f"清空后的集合: {temp_set}n")# 3. 集合运算（数学集合操作）# 并集 (Union)：union() 方法或 | 运算符union_set = set1.union(set2)# union_set = set1 | set2print(f"集合1和集合2的并集: {union_set}")# 交集 (Intersection)：intersection() 方法或 & 运算符intersection_set = set1.intersection(set2)# intersection_set = set1 & set2print(f"集合1和集合2的交集: {intersection_set}")# 差集 (Difference)：difference() 方法或 - 运算符difference_set = set1.difference(set2) # 集合1中有但集合2中没有的元素# difference_set = set1 - set2print(f"集合1和集合2的差集 (set1 - set2): {difference_set}")# 对称差集 (Symmetric Difference)：symmetric_difference() 方法或 ^ 运算符symmetric_difference_set = set1.symmetric_difference(set2) # 两个集合中独有的元素# symmetric_difference_set = set1 ^ set2print(f"集合1和集合2的对称差集: {symmetric_difference_set}n")# 4. 子集与超集判断# issubset() 方法：判断一个集合是否是另一个集合的子集print(f"集合3是集合1的子集吗? {set3.issubset(set1)}") # Trueprint(f"集合1是集合3的子集吗? {set1.issubset(set3)}") # False# issuperset() 方法：判断一个集合是否是另一个集合的超集print(f"集合1是集合3的超集吗? {set1.issuperset(set3)}") # Trueprint(f"集合3是集合1的超集吗? {set3.issuperset(set1)}") # False# isdisjoint() 方法：判断两个集合是否没有共同元素（不相交）disjoint_set = {100, 200}print(f"集合1和 {disjoint_set} 不相交吗? {set1.isdisjoint(disjoint_set)}") # Trueprint(f"集合1和集合2不相交吗? {set1.isdisjoint(set2)}") # False

这些操作，尤其是集合运算，在处理数据关系时非常强大。比如，我曾经需要找出两个用户组中既不重叠，又不是完全包含关系的用户，对称差集就完美解决了这个问题。使用这些内置方法，代码不仅更简洁，而且通常比手动循环判断要高效得多。

在实际开发中，什么时候选择使用集合（set）而不是列表或元组？

这是一个很实际的问题，也是我经常在代码审查时会关注的地方。选择合适的数据结构，能让你的代码更高效、更易读。

最核心的考量点，我觉得在于你对元素唯一性和查找效率的需求。

如果你需要一个容器来存储一系列元素，并且：

不关心元素的顺序。确保所有元素都是唯一的。需要频繁地检查某个元素是否存在（成员资格测试）。需要进行数学上的集合运算（并集、交集、差集等）。

那么，集合（set）就是你的首选。它的内部实现（哈希表）使得成员资格测试的平均时间复杂度是 O(1)，这意味着无论集合有多大，查找一个元素的速度都非常快。这与列表（list）的 O(n) 查找速度形成了鲜明对比，当列表非常大时，查找效率会显著下降。

举个例子：假设你正在开发一个用户权限管理系统，每个用户可能有多个角色，每个角色又包含多个权限。你需要快速判断一个用户是否拥有某个特定权限。

如果你用列表来存储权限，每次判断都需要遍历列表，效率低下。但如果将用户的权限存储在一个集合中，

'admin_permission' in user_permissions_set

这样的操作几乎是瞬时的。

再比如，在数据清洗阶段，我经常会从不同的数据源获取用户ID。如果我需要统计所有不重复的用户ID，把它们全部放到一个列表中，然后手动去重（比如用循环加条件判断），那会非常慢且容易出错。但如果直接扔进一个集合，重复的ID会自动被忽略，最终集合里就是所有不重复的ID。

相比之下：

列表（list）：当你需要一个有序的元素序列，且元素可以重复，并且经常需要通过索引访问元素时，列表是最佳选择。元组（tuple）：当你需要一个有序且不可变的元素序列时，元组是理想选择。它通常用于表示固定大小、不可更改的数据集，例如坐标点

(x, y)

。

所以，选择哪种数据结构，真的取决于你的具体需求。没有绝对的好坏，只有是否适合当前场景。在我的经验里，很多人习惯性地用列表，但在很多需要去重或快速查找的场景，切换到集合会带来意想不到的性能提升和代码简化。这种思维上的转变，往往是写出更优雅、更高效Python代码的关键一步。

以上就是Python怎么创建一个集合（set）_Python集合创建与使用详解的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1372316.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Python怎么使用try-except处理异常_Python异常处理机制详解

上一篇 2025年12月14日 12:13:29

使用单调栈优化Python代码的时间复杂度：一个将数字编码的案例

下一篇 2025年12月14日 12:13:39

好文分享

如何利用BFC和inline-block解决兄弟元素间margin塌陷问题？

BFC清除兄弟元素间margin塌陷原理 margin塌陷问题当相邻的块级元素垂直排列，它们的margin可能会塌陷并重叠，称为margin塌陷。 BFC清除margin塌陷清除margin塌陷的一种常见方法是将下方元素包裹在一个新的块级格式化上下文（BFC）中，因为BFC之间不会相互影响。 d…

程序猿
2025年12月24日
6000
好文分享

如何优化CSS Grid布局中子元素排列和宽度问题？

css grid布局中的优化问题在使用css grid布局时可能会遇到以下问题：问题1：无法控制box1中li的布局 box1设置了grid-template-columns: repeat(auto-fill, 20%)，这意味着容器将自动填充尽可能多的20%宽度的列。当li数量大于5时，它们…

程序猿
2025年12月24日
9000
为什么设置 `overflow: hidden` 会导致 `inline-block` 元素错位？

overflow 导致 inline-block 元素错位解析当多个 inline-block 元素并列排列时，可能会出现错位显示的问题。这通常是由于其中一个元素设置了 overflow 属性引起的。问题现象在不设置 overflow 属性时，元素按预期显示在同一水平线上：不设置 overf…

程序猿
2025年12月24日 • 好文分享
5000
好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
4000
好文分享

面板翻页显示16张图片和信息，如何实现模块靠左显示并按行排列？

如何在面板上翻页显示16个图片和信息，如何设置div内的模块靠左显示，模块内容按行显示？问题：在面板上翻页显示16个图片和信息，如何设置div内的模块靠左显示，模块内容按行显示，设置了float没有效果。已知信息：图片和信息使用json数据定义。使用paginationbyjs函数进行分页。使…

程序猿
2025年12月24日
0000
好文分享

如何在面板上翻页显示16个图片和信息，并实现模块靠左显示、内容按行排列？

如何设置div内的模块靠左显示，模块内容按行显示？问题：在面板上翻页显示16个图片和信息，如何设置div内的模块靠左显示，模块内容按行显示，设置了float没有效果。答案：要将div内的模块靠左显示，并按行排列模块内容，可以使用以下方式：给div容器添加flexbox属性： #list {…

程序猿
2025年12月24日
0000
好文分享

如何实现 div 内模块靠左显示并按行排列，且翻页显示图片和信息？

如何设置div内的模块靠左显示，模块内容按行显示？在面板上翻页显示16个图片和信息，如何设置div内的模块靠左显示，模块内容按行显示，设置了float没有效果中间部分里面的图片，文字显示在图片下方第二页图片靠左显示以上就是如何实现 div 内模块靠左显示并按行排列，且翻页显示图片和信息？的…

程序猿
2025年12月24日
0000
好文分享

inline-block元素错位了，是为什么？

inline-block元素错位背后的原因 inline-block元素是一种特殊类型的块级元素，它可以与其他元素行内排列。但是，在某些情况下，inline-block元素可能会出现错位显示的问题。错位的原因当inline-block元素设置了overflow:hidden属性时，它会影响元素的…

程序猿
2025年12月24日
1000
好文分享

如何让 div 内的模块靠左显示，模块内容按行排列，并在面板上实现翻页展示？

如何设置div内的模块靠左显示，模块内容按行显示？在面板上翻页显示16个图片和信息，如何设置div内的模块靠左显示，模块内容按行显示，设置了float没有效果 css 代码： #List { display: flex; flex-wrap: wrap;}#List > div { text…

程序猿
2025年12月24日
0000
好文分享

如何使用 CSS Grid 布局实现固定头部和动态渲染的子元素布局？

如何实现固定布局和遍历 div？如图所示，第一个 div 固定在页面顶部，后四个 div 通过 for 循环动态渲染在下方。询问如何实现此布局，以及是否有更好的解决方案。解决方案： grid 布局立即学习“前端免费学习笔记（深入）”； grid 布局非常适合解决此问题： html 代码：固定…

程序猿
2025年12月24日
0000
好文分享

Flex 布局中，padding-right 为何无效？

在 flex 布局中，padding-right 为何无效？在使用 flex 布局时，当父元素设置了 padding-right，而内部元素纵向排列且高度固定，并允许横向滑动时，padding-right 可能不起作用。解决此问题的一个方法是修改父元素的 width 属性。将 width: 10…

程序猿
2025年12月24日
2000
好文分享

为什么自定义样式表在 Safari 中访问百度页面时无法生效？

自定义样式表在 safari 中失效的原因用户尝试在 safari 偏好设置中添加自定义样式表，代码如下： body { background-image: url(“/users/luxury/desktop/wallhaven-o5762l.png”) !important;} 测试后发现，在…

程序猿
2025年12月24日
1000
好文分享

如何用 CSS 实现固定布局和遍历生成的 DIV，使其第一个固定不动，剩余的以 1234 顺序排列？

如何实现固定布局和遍历div 如图所示，大的div固定在第一个位置，而标有1234的div则是通过for循环生成的。能否实现这样的布局，或者有更好的解决方案？解决方案：要实现这样的布局，推荐使用grid布局，它可以完美地解决这个问题。立即学习“前端免费学习笔记（深入）”；布局如下：第一个d…

程序猿
2025年12月24日
0000
如何用CSS Grid布局实现首个div固定位置，其他div自动排列？

css布使用固定布局和遍历div 如图所示，有一个大的div固定在第一个位置，里面有若干个通过for循环生成的div，编号为1、2、3、4。解决方案使用css的grid布局可以完美解决这个问题。立即学习“前端免费学习笔记（深入）”； html结构固定不动其他1 其他2 其他3 其他4 其他…

程序猿
好文分享 2025年12月24日
0000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
3000
好文分享

如何使用 Grid 布局解决固定布局和遍历 Div 问题？

解决固定布局和遍历 div 问题在开发中，我们有时需要创建固定布局中循环生成的元素。使用传统的定位方法可能比较复杂，这里为大家推荐一个完美的解决方案：grid 布局。方案：使用 grid 布局，设置容器为一行两列布局，第一个元素占据两行一列，其他元素自动排列。为容器设置边框和间距样式。为第一个…

程序猿
2025年12月24日
6000
垂直排版如何解决纵向展示文字溢出问题？

纵向展示文字溢出的省略号处理在纵向排列的文字中，传统的水平溢出省略方案变得不适用。针对这一问题，css 提供了一种优雅的解决方案：垂直排版。垂直排版方案通过 css 的 writing-mode 属性，可以将原先水平排列的文字垂直排列。具体代码如下： p { writing-mode: ver…

程序猿
好文分享 2025年12月24日
0000
好文分享

如何实现与设计稿一致的前端进度条？

前端进度条的实现方案及优化方法要实现一个如设计稿所示的进度条，以下是一些思路：自定义原生进度条优点：可高度定制，可以满足各种特殊需求。缺点：需要自己编写所有代码，包括圆环效果和鼠标移上提示信息。立即学习“前端免费学习笔记（深入）”；基于 Element-UI 进度条优点：使用现成组件，可…

程序猿
2025年12月24日
0000
如何在网页 F12 调试中查看鼠标悬停时才出现的 DOM 元素？

如何在网页 f12 调试中查看鼠标悬停时才出现的 dom 元素？在 f12 调试模式下，鼠标悬停时才出现的 dom 元素无法通过直接选择查看。解决方法根据显示原理的不同而有所区别： 1. css 控制的元素强制开启悬停状态：在 firefox 浏览器中，可以通过在开发者工具中手动开启选中元素的 …

程序猿
2025年12月24日 • 好文分享
2000
好文分享

掌握 Flexbox：我关于构建响应式布局的学习笔记

好吧，喝杯咖啡（或者茶，我们不评判），让我们深入flexbox的世界！如果您曾因试图让网页在任何设备上看起来都不错而感到沮丧 – 别担心，您并不孤单。 flexbox 来拯救世界，相信我，它并不像听起来那么可怕！ flexbox 到底是什么？ flexbox 就像您的个人布局助手，可以…

程序猿
2025年12月24日
0000