Python如何实现排序？算法与内置方法

程序猿 • 2025年12月14日 04:30:41 • 用户投稿 • 阅读 0

python中实现排序主要依赖内置的list.sort()方法和sorted()函数，它们底层基于高效的timsort算法，同时也可以手动实现冒泡、快速、归并等经典排序算法。1. list.sort()方法直接在原列表上排序，不返回新列表；2. sorted()函数接受任何可迭代对象并返回新排序列表，原始数据不变；3. 二者均支持key参数和reverse参数，实现自定义排序逻辑；4. timsort结合归并排序和插入排序优点，具备稳定性、高效性和适应性；5. 内置排序性能远优于手动实现，适用于绝大多数实际场景；6. 对复杂数据或自定义对象排序时，可使用lambda表达式或operator模块的attrgetter/itemgetter；7. 处理大数据量时，需关注内存、cpu及i/o瓶颈，优化策略包括简化key函数、预计算、分块处理、使用heapq等部分排序方法。

Python中实现排序主要依赖其内置的list.sort()方法和sorted()函数，它们底层都基于高效的Timsort算法。此外，为了理解算法原理或应对特定场景，我们也可以手动实现如冒泡、快速、归并等经典排序算法。

解决方案

Python在处理数据排序时，提供了非常便捷且性能优异的内置工具，同时也不排斥我们自己动手实现那些经典的排序算法，毕竟理解原理有时候比直接使用更重要。

内置排序方法与函数：

立即学习“Python免费学习笔记（深入）”；

list.sort() 方法：这是列表（list）对象自带的方法，它会直接在原地修改列表，不会返回新的列表。这意味着原有的数据顺序会被覆盖。

my_list = [3, 1, 4, 1, 5, 9, 2, 6]my_list.sort() # 原地排序print(my_list) # 输出: [1, 1, 2, 3, 4, 5, 6, 9]# 降序排序my_list.sort(reverse=True)print(my_list) # 输出: [9, 6, 5, 4, 3, 2, 1, 1]

sorted() 函数：这是一个内置函数，它可以接受任何可迭代对象（如列表、元组、字符串、字典的键等），并返回一个新的、已排序的列表。原始的可迭代对象不会被修改。

my_tuple = (3, 1, 4, 1, 5)sorted_list = sorted(my_tuple)print(sorted_list) # 输出: [1, 1, 3, 4, 5]print(my_tuple)    # 输出: (3, 1, 4, 1, 5) - 原始元组不变my_string = "python"sorted_chars = sorted(my_string)print(sorted_chars) # 输出: ['h', 'n', 'o', 'p', 't', 'y']# 结合 key 参数进行自定义排序words = ["banana", "apple", "cherry", "date"]# 按字符串长度排序sorted_by_length = sorted(words, key=len)print(sorted_by_length) # 输出: ['date', 'apple', 'banana', 'cherry']# 结合 lambda 表达式和 reversedata = [{"name": "Alice", "age": 30}, {"name": "Bob", "age": 25}]sorted_by_age_desc = sorted(data, key=lambda x: x["age"], reverse=True)print(sorted_by_age_desc) # 输出: [{'name': 'Alice', 'age': 30}, {'name': 'Bob', 'age': 25}]

这两个内置功能在底层都使用了Timsort算法，它是一种混合排序算法，结合了归并排序（Merge Sort）和插入排序（Insertion Sort）的优点，在实际数据中表现非常高效。

手动实现排序算法（示例）：

虽然内置方法足够强大，但理解算法原理是另一回事。这里简单展示几个经典算法的Python实现：

冒泡排序 (Bubble Sort)：简单直观，但效率较低，尤其不适合大数据量。它通过重复遍历列表，比较相邻元素并交换位置，直到没有元素需要交换。

def bubble_sort(arr):    n = len(arr)    for i in range(n - 1):        swapped = False        for j in range(n - 1 - i):            if arr[j] > arr[j+1]:                arr[j], arr[j+1] = arr[j+1], arr[j]                swapped = True        if not swapped: # 如果一趟下来没有交换，说明已经有序            break    return arr# print(bubble_sort([64, 34, 25, 12, 22, 11, 90])) # 输出: [11, 12, 22, 25, 34, 64, 90]

快速排序 (Quick Sort)：通常情况下性能优异，是一种分治算法。它选择一个“基准”（pivot）元素，将数组分成两部分：小于基准的和大于基准的，然后递归地对这两部分进行排序。

def quick_sort(arr):    if len(arr) <= 1:        return arr    pivot = arr[len(arr) // 2]    left = [x for x in arr if x  pivot]    return quick_sort(left) + middle + quick_sort(right)# print(quick_sort([3, 6, 8, 10, 1, 2, 1])) # 输出: [1, 1, 2, 3, 6, 8, 10]

归并排序 (Merge Sort)：也是一种分治算法，稳定且性能稳定（O(n log n)）。它将列表递归地分成两半，直到每个子列表只有一个元素，然后将这些子列表合并（merge）成一个有序的列表。

def merge_sort(arr):    if len(arr) <= 1:        return arr    mid = len(arr) // 2    left_half = arr[:mid]    right_half = arr[mid:]    left_sorted = merge_sort(left_half)    right_sorted = merge_sort(right_half)    return merge(left_sorted, right_sorted)def merge(left, right):    result = []    i = j = 0    while i < len(left) and j < len(right):        if left[i] < right[j]:            result.append(left[i])            i += 1        else:            result.append(right[j])            j += 1    result.extend(left[i:])    result.extend(right[j:])    return result# print(merge_sort([38, 27, 43, 3, 9, 82, 10])) # 输出: [3, 9, 10, 27, 38, 43, 82]

Python内置排序机制的工作原理是什么？它比手动实现算法更优吗？

Python内置的sort()方法和sorted()函数都采用了名为Timsort的混合排序算法。Timsort是一个非常聪明的设计，它结合了归并排序（Merge Sort）和插入排序（Insertion Sort）的优点。它的核心思想是：对于小块数据（通常是几十个元素），插入排序非常高效；而对于大块数据，归并排序的O(n log n)复杂度则更有优势。

具体来说，Timsort会先将输入数据分解成一系列“自然有序的”或“部分有序的”子序列（称为runs）。如果某个run的长度小于预设的最小长度（通常是32或64），它会使用插入排序将其扩展到最小长度并使其有序。接着，Timsort会使用归并排序的思想，将这些有序的runs合并起来，直到所有数据都合并成一个完整的有序序列。

Timsort的优势在于：

稳定性： 对于相等元素的排序，Timsort能保持它们在原始输入中的相对顺序，这在处理复杂数据结构时非常有用。高效性： 平均和最坏情况下的时间复杂度都是O(n log n)。适应性： 它能识别并利用数据中已存在的有序性，对于部分有序的数据，它的性能会非常接近O(n)。内存优化： 归并排序通常需要额外的O(n)空间，Timsort通过巧妙的策略，将辅助空间需求降到了O(n/2)甚至更低，在某些情况下可以做到O(1)的额外空间。

它比手动实现算法更优吗？

绝大多数情况下，是的，Timsort比我们手动实现的任何经典排序算法都要优越。

我个人觉得，如果你不是在研究算法本身，或者有极其特殊的需求，直接用内置的就对了，省心又高效。原因有几点：

C语言实现： Python的Timsort是用C语言实现的，这意味着它的执行速度远超纯Python代码。Python解释器本身的开销，使得纯Python实现的算法在性能上很难与C语言相匹敌。高度优化： Timsort的实现经过了多年的优化和测试，考虑了各种边缘情况和数据分布，包括内存访问模式、缓存利用率等，这些细节在普通的算法实现中很难兼顾。通用性： 它能优雅地处理各种数据类型，包括数字、字符串、自定义对象，并且可以通过key参数轻松实现复杂排序逻辑。稳定性： 对于许多应用场景，排序的稳定性是必要的，而Timsort天然支持。

所以，除非你真的在做算法性能对比实验，或者有非常奇特的、Timsort无法满足的特定需求（这种情况极其罕见），否则，直接使用list.sort()和sorted()是最佳选择。自己实现算法更多是为了学习和理解，而不是为了生产环境的性能。

如何根据复杂条件或自定义对象属性进行排序？

在实际开发中，我们很少会遇到只对数字或字符串进行简单升序排列的需求。更多时候，我们需要根据对象的某个特定属性、多个属性的组合、或者通过一个自定义的计算逻辑来决定排序顺序。Python的key参数就是为此而生，它允许你指定一个函数，这个函数会在排序前应用于列表中的每个元素，并返回一个用于比较的值。

这块功能是真的强大，我以前刚接触的时候，觉得能把对象按各种奇奇怪怪的规则排好序，简直是魔法。尤其是处理一些业务数据时，简直是救星。

使用 key 参数和 lambda 表达式：

key参数接受一个函数，这个函数会作用于列表中的每一个元素，并返回一个用于比较的值。lambda表达式在这里非常常用，因为它提供了一种简洁的方式来定义匿名函数。

按字符串长度排序：

words = ["apple", "banana", "kiwi", "grapefruit"]# 按单词长度升序sorted_by_len = sorted(words, key=len)print(sorted_by_len) # 输出: ['kiwi', 'apple', 'banana', 'grapefruit']

按字典中某个键的值排序：

students = [    {"name": "Alice", "age": 20, "score": 85},    {"name": "Bob", "age": 22, "score": 90},    {"name": "Charlie", "age": 20, "score": 78}]# 按分数降序排序sorted_by_score = sorted(students, key=lambda s: s["score"], reverse=True)print(sorted_by_score)# 输出: [{'name': 'Bob', 'age': 22, 'score': 90}, {'name': 'Alice', 'age': 20, 'score': 85}, {'name': 'Charlie', 'age': 20, 'score': 78}]# 先按年龄升序，年龄相同则按分数降序sorted_multi_criteria = sorted(students, key=lambda s: (s["age"], -s["score"]))print(sorted_multi_criteria)# 输出: [{'name': 'Charlie', 'age': 20, 'score': 78}, {'name': 'Alice', 'age': 20, 'score': 85}, {'name': 'Bob', 'age': 22, 'score': 90}]# 注意：-s["score"] 是为了实现降序，因为默认是升序。

使用 operator 模块的 attrgetter 和 itemgetter：

对于常见的按对象属性或字典键排序的场景，operator模块提供了更高效的函数：attrgetter和itemgetter。它们返回一个可调用的对象，比lambda表达式在性能上略有优势，尤其是在处理大量数据时。

按自定义对象属性排序：

from operator import attrgetterclass Product:    def __init__(self, name, price, stock):        self.name = name        self.price = price        self.stock = stock    def __repr__(self): # 为了方便打印        return f"Product({self.name}, ${self.price}, Stock:{self.stock})"products = [    Product("Laptop", 1200, 50),    Product("Mouse", 25, 200),    Product("Keyboard", 75, 100)]# 按价格升序sorted_by_price = sorted(products, key=attrgetter("price"))print(sorted_by_price)# 输出: [Product(Mouse, $25, Stock:200), Product(Keyboard, $75, Stock:100), Product(Laptop, $1200, Stock:50)]# 先按库存降序，库存相同则按价格升序sorted_multi_attr = sorted(products, key=attrgetter("stock", "price"), reverse=True) # reverse=True 只对第一个元素生效# 如果要实现 stock 降序，price 升序，需要更复杂的 keysorted_multi_attr_custom = sorted(products, key=lambda p: (-p.stock, p.price))print(sorted_multi_attr_custom)# 输出: [Product(Mouse, $25, Stock:200), Product(Keyboard, $75, Stock:100), Product(Laptop, $1200, Stock:50)]

按字典键排序（等同于lambda x: x[‘key’]）：

from operator import itemgetterstudents = [    {"name": "Alice", "age": 20, "score": 85},    {"name": "Bob", "age": 22, "score": 90},]sorted_by_name = sorted(students, key=itemgetter("name"))print(sorted_by_name)# 输出: [{'name': 'Alice', 'age': 20, 'score': 85}, {'name': 'Bob', 'age': 22, 'score': 90}]

这些方法提供了极大的灵活性，让你可以根据几乎任何自定义逻辑来排序Python中的数据结构，无论是简单的元组、字典还是复杂的自定义对象。

在处理大量数据时，排序的性能瓶颈和优化策略有哪些？

处理大量数据时，排序可不是简单的 list.sort() 一句代码就能搞定的了。我记得有一次，一个几千万行的日志文件要按时间戳排序，直接加载内存就爆了，那会儿才意识到，排序这事儿，还真不是小打小闹。它可能会成为整个应用程序的性能瓶颈，尤其是在内存、CPU和I/O方面。

常见的性能瓶颈：

内存限制 (Memory Limits)：

数据量过大： 当数据量远超可用内存时，直接加载到内存中进行排序会导致MemoryError。即使不报错，频繁的内存交换（swapping）也会极大降低性能。临时空间需求： 某些排序算法（如归并排序）需要额外的临时存储空间，即使是Timsort也需要一部分辅助空间。

CPU 密集型操作 (CPU-Intensive Operations)：

比较操作的开销： 排序的核心是元素的比较。如果key函数执行的逻辑非常复杂或耗时（例如，涉及数据库查询、网络请求、复杂的正则匹配等），那么即使是O(n log n)的算法，其常数因子也会变得非常大，导致整体速度变慢。元素交换/移动： 尤其对于大型对象，每次交换或移动元素可能涉及大量内存拷贝，增加CPU负担。

I/O 瓶颈 (I/O Bottlenecks)：

数据读取/写入： 如果数据存储在磁盘上（如文件、数据库），那么从磁盘读取数据和将排序结果写回磁盘的I/O速度可能会成为主要瓶颈，而不是排序算法本身。

优化策略：

优化 key 函数：这是最直接也最常见的优化点。确保key函数尽可能地快。

避免复杂计算： key函数应该只做最少的必要计算来提取比较值。使用 operator.attrgetter 或 operator.itemgetter： 对于按属性或字典键排序，它们通常比lambda表达式更高效。预计算： 如果key函数的计算成本很高，并且数据不会改变，可以考虑在排序前预先计算好所有元素的key值，然后创建一个包含(key_value, original_element)的元组列表，再对这个列表进行排序。

利用部分排序或近似排序：

heapq.nlargest() / heapq.nsmallest()： 如果你只需要找到最大/最小的N个元素，而不需要对整个列表排序，heapq模块提供了非常高效的方法（时间复杂度O(N log K)，K为N个元素）。

import heapqdata = [1, 8, 2, 7, 3, 6, 4, 5]# 找出最大的3个元素largest_3 = heapq.nlargest(3, data) # [8, 7, 6]

bisect 模块： 如果你需要在已排序的列表中插入元素并保持有序，或者查找某个元素的位置，bisect模块非常有用，避免了每次插入都重新排序整个列表。

分块处理 (Chunking) 或外部排序 (External Sorting)：当数据量大到无法一次性加载到

以上就是Python如何实现排序？算法与内置方法的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1365248.html

c语言 python python教程冒泡排序可迭代对象工具排列数据排序

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Django URL 404错误：路径匹配顺序导致的问题与解决方案

上一篇 2025年12月14日 04:30:34

Python如何实现二叉树？数据结构进阶

下一篇 2025年12月14日 04:30:44

好文分享

如何利用BFC和inline-block解决兄弟元素间margin塌陷问题？

BFC清除兄弟元素间margin塌陷原理 margin塌陷问题当相邻的块级元素垂直排列，它们的margin可能会塌陷并重叠，称为margin塌陷。 BFC清除margin塌陷清除margin塌陷的一种常见方法是将下方元素包裹在一个新的块级格式化上下文（BFC）中，因为BFC之间不会相互影响。 d…

程序猿
2025年12月24日
6000
好文分享

如何优化CSS Grid布局中子元素排列和宽度问题？

css grid布局中的优化问题在使用css grid布局时可能会遇到以下问题：问题1：无法控制box1中li的布局 box1设置了grid-template-columns: repeat(auto-fill, 20%)，这意味着容器将自动填充尽可能多的20%宽度的列。当li数量大于5时，它们…

程序猿
2025年12月24日
9000
为什么设置 `overflow: hidden` 会导致 `inline-block` 元素错位？

overflow 导致 inline-block 元素错位解析当多个 inline-block 元素并列排列时，可能会出现错位显示的问题。这通常是由于其中一个元素设置了 overflow 属性引起的。问题现象在不设置 overflow 属性时，元素按预期显示在同一水平线上：不设置 overf…

程序猿
2025年12月24日 • 好文分享
5000
好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
3000
好文分享

面板翻页显示16张图片和信息，如何实现模块靠左显示并按行排列？

如何在面板上翻页显示16个图片和信息，如何设置div内的模块靠左显示，模块内容按行显示？问题：在面板上翻页显示16个图片和信息，如何设置div内的模块靠左显示，模块内容按行显示，设置了float没有效果。已知信息：图片和信息使用json数据定义。使用paginationbyjs函数进行分页。使…

程序猿
2025年12月24日
0000
好文分享

如何在面板上翻页显示16个图片和信息，并实现模块靠左显示、内容按行排列？

如何设置div内的模块靠左显示，模块内容按行显示？问题：在面板上翻页显示16个图片和信息，如何设置div内的模块靠左显示，模块内容按行显示，设置了float没有效果。答案：要将div内的模块靠左显示，并按行排列模块内容，可以使用以下方式：给div容器添加flexbox属性： #list {…

程序猿
2025年12月24日
0000
好文分享

如何实现 div 内模块靠左显示并按行排列，且翻页显示图片和信息？

如何设置div内的模块靠左显示，模块内容按行显示？在面板上翻页显示16个图片和信息，如何设置div内的模块靠左显示，模块内容按行显示，设置了float没有效果中间部分里面的图片，文字显示在图片下方第二页图片靠左显示以上就是如何实现 div 内模块靠左显示并按行排列，且翻页显示图片和信息？的…

程序猿
2025年12月24日
0000
好文分享

inline-block元素错位了，是为什么？

inline-block元素错位背后的原因 inline-block元素是一种特殊类型的块级元素，它可以与其他元素行内排列。但是，在某些情况下，inline-block元素可能会出现错位显示的问题。错位的原因当inline-block元素设置了overflow:hidden属性时，它会影响元素的…

程序猿
2025年12月24日
1000
好文分享

如何让 div 内的模块靠左显示，模块内容按行排列，并在面板上实现翻页展示？

如何设置div内的模块靠左显示，模块内容按行显示？在面板上翻页显示16个图片和信息，如何设置div内的模块靠左显示，模块内容按行显示，设置了float没有效果 css 代码： #List { display: flex; flex-wrap: wrap;}#List > div { text…

程序猿
2025年12月24日
0000
好文分享

如何使用 CSS Grid 布局实现固定头部和动态渲染的子元素布局？

如何实现固定布局和遍历 div？如图所示，第一个 div 固定在页面顶部，后四个 div 通过 for 循环动态渲染在下方。询问如何实现此布局，以及是否有更好的解决方案。解决方案： grid 布局立即学习“前端免费学习笔记（深入）”； grid 布局非常适合解决此问题： html 代码：固定…

程序猿
2025年12月24日
0000
好文分享

Flex 布局中，padding-right 为何无效？

在 flex 布局中，padding-right 为何无效？在使用 flex 布局时，当父元素设置了 padding-right，而内部元素纵向排列且高度固定，并允许横向滑动时，padding-right 可能不起作用。解决此问题的一个方法是修改父元素的 width 属性。将 width: 10…

程序猿
2025年12月24日
2000
好文分享

如何用 CSS 实现固定布局和遍历生成的 DIV，使其第一个固定不动，剩余的以 1234 顺序排列？

如何实现固定布局和遍历div 如图所示，大的div固定在第一个位置，而标有1234的div则是通过for循环生成的。能否实现这样的布局，或者有更好的解决方案？解决方案：要实现这样的布局，推荐使用grid布局，它可以完美地解决这个问题。立即学习“前端免费学习笔记（深入）”；布局如下：第一个d…

程序猿
2025年12月24日
0000
如何用CSS Grid布局实现首个div固定位置，其他div自动排列？

css布使用固定布局和遍历div 如图所示，有一个大的div固定在第一个位置，里面有若干个通过for循环生成的div，编号为1、2、3、4。解决方案使用css的grid布局可以完美解决这个问题。立即学习“前端免费学习笔记（深入）”； html结构固定不动其他1 其他2 其他3 其他4 其他…

程序猿
好文分享 2025年12月24日
0000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
3000
好文分享

如何使用 Grid 布局解决固定布局和遍历 Div 问题？

解决固定布局和遍历 div 问题在开发中，我们有时需要创建固定布局中循环生成的元素。使用传统的定位方法可能比较复杂，这里为大家推荐一个完美的解决方案：grid 布局。方案：使用 grid 布局，设置容器为一行两列布局，第一个元素占据两行一列，其他元素自动排列。为容器设置边框和间距样式。为第一个…

程序猿
2025年12月24日
6000
垂直排版如何解决纵向展示文字溢出问题？

纵向展示文字溢出的省略号处理在纵向排列的文字中，传统的水平溢出省略方案变得不适用。针对这一问题，css 提供了一种优雅的解决方案：垂直排版。垂直排版方案通过 css 的 writing-mode 属性，可以将原先水平排列的文字垂直排列。具体代码如下： p { writing-mode: ver…

程序猿
好文分享 2025年12月24日
0000
好文分享

如何实现与设计稿一致的前端进度条？

前端进度条的实现方案及优化方法要实现一个如设计稿所示的进度条，以下是一些思路：自定义原生进度条优点：可高度定制，可以满足各种特殊需求。缺点：需要自己编写所有代码，包括圆环效果和鼠标移上提示信息。立即学习“前端免费学习笔记（深入）”；基于 Element-UI 进度条优点：使用现成组件，可…

程序猿
2025年12月24日
0000
好文分享

掌握 Flexbox：我关于构建响应式布局的学习笔记

好吧，喝杯咖啡（或者茶，我们不评判），让我们深入flexbox的世界！如果您曾因试图让网页在任何设备上看起来都不错而感到沮丧 – 别担心，您并不孤单。 flexbox 来拯救世界，相信我，它并不像听起来那么可怕！ flexbox 到底是什么？ flexbox 就像您的个人布局助手，可以…

程序猿
2025年12月24日
0000
好文分享

如何使用 CSS 实现横向排列带横线和圆圈的元素？

一个 CSS 样式的实现如何使用 CSS 实现上图中红框所示的效果？其中，横向排列、内容居中，并且有横线和圆圈。解答：要实现该效果，需要使用多个 CSS 属性：立即学习“前端免费学习笔记（深入）”；横向排列和内容居中：使用元素并将其 text-align 属性设置为 “ce…

程序猿
2025年12月24日
3000
如何用 CSS 实现图中所示的点线效果？

如何用 CSS 实现图中的点线效果？要实现图中所示的效果，可以按照以下步骤进行：放置元素首先，将元素水平排列并设置文本居中。这可以使用 text-align:center 属性来实现。创建横线最简单的创建横线的方法是使用上边框，但要注意第一个和最后一个元素的横线会缺一半。立即学习“前端免…

程序猿
好文分享 2025年12月24日
1000