直接访问数组排序：基于键实现对象排序的机制与实践

程序猿 • 2025年12月14日 23:05:04 • 好文分享 • 阅读 0

直接访问数组排序是一种利用键作为数组索引的线性时间排序算法。它通过构建一个辅助数组，将原始数据项（包含键和值）直接存储在与其键对应的位置。随后，按键的自然顺序遍历辅助数组，即可高效地提取出完整的、已排序的数据项，从而实现对“值”而非仅仅“键”的排序，但要求键为不重复的非负整数。

什么是直接访问数组排序？

直接访问数组排序（Direct Access Array Sort）是一种非比较排序算法，它适用于待排序数据项的键满足特定条件的情况：键必须是唯一的、非负的整数。该算法的核心思想是利用键值作为数组的索引，将数据项直接放置到辅助数组的相应位置，从而在后续遍历时，自然地按照键的顺序取出数据项。

算法原理与实现

该算法通常分为两个主要阶段：插入阶段和读取阶段。以下是其Python实现示例：

class Item:    def __init__(self, key, value=None):        self.key = key        self.value = value # 假设每个数据项除了键还有其他值    def __repr__(self):        return f"{{key: {self.key}, value: {self.value}}}"def direct_access_sort(A):    """    使用直接访问数组对列表A进行排序。    假设A中的每个元素都是一个包含'key'属性的对象，    且键是唯一的、非负整数。    """    if not A:        return []    # 1. 确定最大键值 (O(n))    # 找到所有数据项中的最大键，以确定直接访问数组的大小。    max_key = max([x.key for x in A])    u = max_key + 1 # 数组大小为 max_key + 1，以包含从0到max_key的所有键    # 2. 创建直接访问数组 (O(u))    # 初始化一个大小为u的数组D，所有位置初始为None。    D = [None] * u    # 3. 插入数据项到直接访问数组 (O(n))    # 遍历原始数组A，将每个数据项x根据其键x.key放置到D的相应索引处。    for x in A:        D[x.key] = x # 注意：这里存储的是整个数据项x，而非仅仅是x.key    # 4. 按顺序从直接访问数组中读取数据项 (O(u))    # 初始化一个计数器i，用于填充排序后的数组A。    i = 0    # 遍历D数组的每个索引（即可能的键值）。    for key in range(u):        # 如果D[key]不为None，说明该键对应位置有数据项。        if D[key] is not None:            # 将D[key]（即完整的排序后的数据项）放回原始数组A的当前位置。            A[i] = D[key]            i += 1 # 移动到下一个待填充位置    return A

工作机制详解：如何实现“值”的排序

原始问题中提到，这种排序似乎只对“键”进行了排序，而非“值”。这实际上是一个常见的误解。直接访问数组排序的核心在于它存储的是完整的数据项，而不仅仅是键。

让我们仔细分析代码中的关键行：

for x in A: # O(n) insert items    D[x.key] = x

当代码执行 D[x.key] = x 时，它将原始数组 A 中的一个数据项 x（这个 x 是一个包含 key 和其他 value 的对象）完整地赋值给了 D 数组中 x.key 对应的索引位置。这意味着 D 数组的每个非空位置存储的都是一个完整的对象，例如 {key: 160, value: “Alice”}。

随后，在读取阶段：

for key in range(u): # O(u) read out items in order    if D[key] is not None:        A[i] = D[key]        i += 1

当 D[key] 被检索时，我们得到的是之前存储的那个完整的对象。例如，如果 D[160] 存储的是 {key: 160, value: “Alice”}，那么 A[i] = D[key] 就会将整个 {key: 160, value: “Alice”} 对象赋值给 A 的当前位置。由于我们是按照 key 从小到大遍历 range(u)，因此，从 D 中取出的数据项自然就是按照它们的键值排好序的，同时它们所包含的“值”也随之被正确地排序了。

因此，直接访问数组排序确实实现了对数据项整体（包括键和值）的排序，只是排序的依据是数据项的键。

示例演示

假设我们有一个包含人员信息的列表，每个人员对象有 key（身高）和 value（姓名）。

# 初始输入数组，包含key和valueA = [    Item(key=160, value="Alice"),    Item(key=150, value="Bob"),    Item(key=200, value="Charlie"),    Item(key=188, value="David")]print("原始数组A:", A)# 原始数组A: [{key: 160, value: Alice}, {key: 150, value: Bob}, {key: 200, value: Charlie}, {key: 188, value: David}]# 1. 确定最大键值# max_key = max([160, 150, 200, 188]) = 200# u = 200 + 1 = 201# 2. 创建直接访问数组# D = [None, None, ..., None] (长度为201)# 3. 插入数据项到直接访问数组# 遍历A:#   x = {key: 160, value: "Alice"} => D[160] = {key: 160, value: "Alice"}#   x = {key: 150, value: "Bob"}   => D[150] = {key: 150, value: "Bob"}#   x = {key: 200, value: "Charlie"} => D[200] = {key: 200, value: "Charlie"}#   x = {key: 188, value: "David"} => D[188] = {key: 188, value: "David"}# 此时，D数组在索引150, 160, 188, 200处有值，其余为None。# 4. 按顺序从直接访问数组中读取数据项# i = 0# for key in range(201):#   key = 0, D[0] is None#   ...#   key = 150, D[150] is not None. A[0] = D[150] => A[0] = {key: 150, value: "Bob"}. i = 1#   key = 151, D[151] is None#   ...#   key = 160, D[160] is not None. A[1] = D[160] => A[1] = {key: 160, value: "Alice"}. i = 2#   ...#   key = 188, D[188] is not None. A[2] = D[188] => A[2] = {key: 188, value: "David"}. i = 3#   ...#   key = 200, D[200] is not None. A[3] = D[200] => A[3] = {key: 200, value: "Charlie"}. i = 4#   ...# 最终，A数组被更新为排序后的结果。sorted_A = direct_access_sort(A)print("排序后数组A:", sorted_A)# 排序后数组A: [{key: 150, value: Bob}, {key: 160, value: Alice}, {key: 188, value: David}, {key: 200, value: Charlie}]

从输出可以看出，原始数据项（包括姓名，即 value）已经根据身高（即 key）进行了排序。

性能分析

时间复杂度:查找最大键：O(n)，其中n是数据项的数量。创建直接访问数组：O(u)，其中u是最大键值加一。插入数据项：O(n)。读取数据项：O(u)。总时间复杂度为 O(n + u)。空间复杂度:直接访问数组 D 需要 O(u) 的额外空间。

适用场景与注意事项

键的特性: 直接访问数组排序要求键必须是：

唯一的: 如果键不唯一，则后插入的数据项会覆盖先插入的，导致数据丢失或排序不正确。非负整数: 键作为数组索引，必须是非负整数。范围有限: 键的范围 u 不宜过大。

稀疏性问题: 如果数据项的数量 n 远小于键的范围 u（例如，只有10个数据项，但键的范围是0到1,000,000），那么 D 数组将非常稀疏，大部分空间会被 None 填充，导致极大的内存浪费。在这种情况下，其 O(u) 的时间复杂度也会变得非常高，效率甚至不如 O(n log n) 的比较排序算法。

与计数排序的关系: 直接访问数组排序与计数排序（Counting Sort）有相似之处，两者都利用了键的整数特性。计数排序通常用于对整数本身进行排序或作为基数排序的子过程，它通过统计每个键出现的次数来确定元素在输出数组中的位置。而直接访问数组排序则是将完整的对象直接放置到键对应的位置。

实际应用: 当键的范围相对较小且键值密集时，直接访问数组排序可以提供非常高效的线性时间排序。例如，对分数、年龄等有限范围内的整数键进行排序。

总结

直接访问数组排序是一种简单而高效的线性时间排序算法，它通过将数据项的键作为辅助数组的索引，实现了对完整数据项的排序。其核心在于直接访问数组存储的是数据项本身，而非仅仅键值。尽管它具有 O(n+u) 的优秀时间复杂度，但其适用性受到键值范围和唯一性的严格限制。在实际应用中，需要根据具体的数据特性权衡其内存消耗和性能表现。

以上就是直接访问数组排序：基于键实现对象排序的机制与实践的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1381580.html

access python 排序算法数据丢失

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Pandas DataFrame中多列组合条件计数：避免常见错误与高效实践

上一篇 2025年12月14日 23:04:57

Tkinter与Matplotlib：在独立窗口中显示实时动态图表的教程

下一篇 2025年12月14日 23:05:13

好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
2000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
2000
好文分享

正则表达式在文本验证中的常见问题有哪些？

正则表达式助力文本输入验证在文本输入框的验证中，经常遇到需要限定输入内容的情况。例如，输入框只能输入整数，第一位可以为负号。对于不会使用正则表达式的人来说，这可能是个难题。下面我们将提供三种正则表达式，分别满足不同的验证要求。 1. 可选负号，任意数量数字如果输入框中允许第一位为负号，后面可输入…

程序猿
2025年12月24日
0000
使用 React 构建 Fylo 云存储网站

介绍在这篇博文中，我们将逐步介绍如何使用 react 创建一个功能丰富的云存储网站。该网站受 fylo 启发，提供了主页、功能、工作原理、感言和页脚等部分。在此过程中，我们将讨论用于构建这个完全响应式网站的结构、组件和样式。项目概况该项目由多个部分组成，旨在展示云存储服务。每个部分都是用 re…

程序猿
2025年12月24日 • 好文分享
0000
使用 React 构建食谱查找器网站

介绍在本博客中，我们将使用 react 构建一个食谱查找网站。该应用程序允许用户搜索他们最喜欢的食谱，查看趋势或新食谱，并保存他们最喜欢的食谱。我们将利用 edamam api 获取实时食谱数据并将其动态显示在网站上。项目概况食谱查找器允许用户：按名称搜索食谱。查看趋势和新添加的食谱。查看各…

程序猿
2025年12月24日 • 好文分享
2000
好文分享

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
0000
好文分享

姜戈顺风

本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

程序猿
2025年12月24日
0000
好文分享

不可变数据结构：ECMA 4 中的记录和元组

不可变数据结构：ecmascript 2024 中的新功能 ecmascript 2024 引入了几个令人兴奋的更新，但对我来说最突出的一个功能是引入了不可变数据结构。这些新结构——记录和元组——改变了 javascript 中数据管理的游戏规则。它们提供了一种令人满意的方式来保持我们的数据健全、安…

程序猿
2025年12月24日
1000
好文分享

花 $o 学习这些编程语言或免费

→ Python → JavaScript → Java → C# → 红宝石 → 斯威夫特 → 科特林 → C++ → PHP → 出发 → R → 打字稿 []https://x.com/e_opore/status/1811567830594388315?t=_j4nncuiy2wfbm7ic…

程序猿
2025年12月24日
0000
好文分享

深度剖析程序设计中必不可少的数据类型分类

【深入解析基本数据类型：掌握编程中必备的数据分类】在计算机编程中，数据是最为基础的元素之一。数据类型的选择对于编程语言的使用和程序的设计至关重要。在众多的数据类型中，基本数据类型是最基础、最常用的数据分类之一。通过深入解析基本数据类型，我们能够更好地掌握编程中必备的数据分类。一、基本数据类型的定…

程序猿
2025年12月24日
0000
好文分享

html5怎么导视频_html5用video标签导出或Canvas转DataURL获视频【导出】

HTML5无法直接导出video标签内容，需借助Canvas捕获帧并结合MediaRecorder API、FFmpeg.wasm或服务端协同实现。MediaRecorder适用于WebM格式前端录制；FFmpeg.wasm支持MP4等格式及精细编码控制；服务端方案适合高负载场景。如果您希望在网页…

程序猿
2025年12月23日
3000
好文分享

如何查看编写的html_查看自己编写的HTML文件效果【效果】

要查看HTML文件的浏览器渲染效果，需确保文件以.html为扩展名保存、用浏览器直接打开、利用开发者工具调试、必要时启用本地HTTP服务器、或使用编辑器实时预览插件。如果您编写了HTML代码，但无法直观看到其在浏览器中的实际渲染效果，则可能是由于文件未正确保存、未使用浏览器打开或文件扩展名设置错误…

程序猿
2025年12月23日
4000
好文分享

html5怎么加php_html5用Ajax与PHP后端交互实现数据传递【交互】

HTML5不能直接运行PHP，需通过Ajax与PHP通信：前端用fetch发送请求，PHP接收处理并返回JSON，前端解析响应更新DOM；注意跨域、编码、CSRF防护和输入过滤。 HTML5 本身是前端标记语言，不能直接运行 PHP 代码，但可以通过 Ajax（异步 JavaScript）与 PHP…

程序猿
2025年12月23日
3000
好文分享

html5怎么打包运行_HT5用Webpack或Gulp打包后浏览器打开运行【打包】

应通过 HTTP 服务运行打包后的 HTML5 页面，而非双击打开：一、Webpack 配 webpack-dev-server 启动本地服务；二、Gulp 配 BrowserSync 提供实时重载；三、用 Python/Node.js 轻量 HTTP 工具托管 dist 目录；四、仅当必须双击运行…

程序猿
2025年12月23日
0000
好文分享

html5文件运行不出来怎么回事_析html5文件运行失败原因【解析】

首先检查文件扩展名和编码格式，确保为.html且使用UTF-8编码；接着验证HTML5结构完整性，包含及正确闭合的标签；然后排查外部资源路径是否正确，利用开发者工具查看404错误；排除浏览器兼容性问题，优先在现代浏览器中测试并避免未广泛支持的API；检查JavaScript语法错误与执行顺序，确保脚…

程序猿
2025年12月23日
0000
好文分享

html5怎么插入文档_HT5用object或iframe嵌入PDF/Word文档显示【插入】

可在HTML5中用iframe或object标签嵌入PDF，需设宽高及可访问路径；Word文档需借OneDrive等第三方服务代理渲染；须处理跨域限制并提供下载降级方案。如果您希望在HTML5页面中嵌入PDF或Word文档并直接显示，可以使用或标签实现。以下是几种可行的嵌入方法：一、使用ifra…

程序猿
2025年12月23日
2000
好文分享

如何运行html代码_html代码运行方法【步骤】

HTML代码需保存为.html文件并用浏览器打开才能正确显示；若含AJAX或外部资源则需本地服务器；临时测试可用开发者工具；在线编辑器支持即时预览。如果您编写了一段HTML代码，但无法在浏览器中正确显示效果，则可能是由于文件未以正确的格式保存或未通过浏览器打开。以下是运行HTML代码的具体步骤： …

程序猿
2025年12月23日
0000
好文分享

html5框架怎么设置_html5用iframe或div框架集嵌入子页面搭整体结构【设置】

HTML5中应使用iframe、div+CSS、object或Web Components替代已废弃的frameset/frame；iframe支持同源嵌入，div+CSS结合JavaScript可动态加载内容，object提供降级支持，Web Components实现可复用嵌入。如果您希望使用 …

程序猿
2025年12月23日
0000
好文分享

safari怎么打开html5_Safari浏览器直接输入html5链接自动渲染打开【打开】

Safari中正确渲染HTML5内容需采用file://协议、禁用本地限制、启用HTTP服务器或更新版本并开启实验性功能。具体包括：一、用file:///绝对路径打开本地HTML文件；二、勾选高级设置中的“显示开发菜单”并禁用本地文件限制；三、用Python启动本地HTTP服务，通过http://l…

程序猿
2025年12月23日
0000
好文分享

html5乱码怎么设置_html5用meta charset=utf-8设编码防页面乱码【设置】

HTML5中文乱码需四步解决：一、在首行添加如果您在浏览 HTML5 页面时遇到中文显示为乱码的情况，则可能是由于网页未正确声明字符编码。以下是解决此问题的步骤：一、在 head 中添加 meta charset 声明 HTML5 推荐使用 meta charset=”UTF-8&#…

程序猿
2025年12月23日
0000