深入理解直接访问数组排序：原理与实现

程序猿 • 2025年12月14日 22:45:47 • 好文分享 • 阅读 0

直接访问数组排序是一种利用数据项的键值作为数组索引来对数据进行排序的算法。它适用于具有唯一、非负整数键的场景，通过构建一个足够大的直接访问数组来存储完整的对象，然后按键的自然顺序遍历该数组，从而高效地重建一个有序的数据序列。本文将详细解析其工作原理、实现步骤，并通过示例代码阐明其如何实现对完整对象的排序，并探讨其适用场景与局限性。

直接访问数组排序原理

直接访问数组排序（Direct Access Array Sort）的核心思想是利用数据项的键（key）作为数组的索引。当所有数据项的键都是唯一且非负的整数时，我们可以创建一个足够大的辅助数组（即直接访问数组），其大小能够覆盖所有可能的键值范围。然后，将每个数据项直接放置到辅助数组中对应其键的索引位置上。由于数组索引的自然有序性，当遍历辅助数组时，我们就能按键的升序依次取出数据项，从而实现对原始数据项的排序。

这种方法之所以能对“值”进行排序，是因为它存储在辅助数组中的是完整的“数据项”（通常是包含键和值的对象），而不仅仅是键本身。键的作用是确定数据项在辅助数组中的位置，而一旦数据项被放置到位，它就带着其所有属性（包括值）一同被“排序”了。

算法实现步骤

直接访问数组排序算法通常包含以下四个主要步骤：

1. 确定键值范围

首先，需要遍历输入数组 A，找出所有数据项中的最大键值。这个最大键值将决定直接访问数组 D 的大小 u（通常是最大键值 + 1）。这一步的时间复杂度为 O(n)，其中 n 是输入数组 A 的长度。

2. 构建直接访问数组

创建一个新的辅助数组 D，其大小为 u，并用一个占位符（如 None）初始化所有位置。这个数组 D 就是我们所说的“直接访问数组”。这一步的空间复杂度为 O(u)。

3. 插入数据项

遍历输入数组 A 中的每一个数据项 x。对于每个 x，将其完整地存储到直接访问数组 D 中，其位置由 x.key 决定，即 D[x.key] = x。这一步的时间复杂度为 O(n)。

4. 有序提取

初始化一个计数器 i = 0，用于跟踪原始数组 A 中下一个可插入的位置。然后，从索引 0 到 u-1 遍历直接访问数组 D。对于 D 中的每一个位置 key，如果 D[key] 不为 None（即该位置存储了一个实际的数据项），则将该数据项 D[key] 复制回原始数组 A 的 A[i] 位置，并递增 i。这一步的时间复杂度为 O(u)。

示例代码与详细解析

以下是直接访问数组排序的Python实现示例，我们将通过一个具体的例子来详细解析其工作流程。

class Item:    """模拟一个包含键和值的通用数据项"""    def __init__(self, key, value=None):        self.key = key        self.value = value if value is not None else f"data_{key}"    def __repr__(self):        return f"{{key: {self.key}, value: '{self.value}'}}"def direct_access_sort(A):    """    直接访问数组排序算法    假设数据项具有唯一且非负的整数键。    """    if not A:        return A    # 步骤一：确定键值范围    # 查找输入数组A中所有项的最大键，并据此确定直接访问数组D的大小u。    # O(n) 时间复杂度。    max_key = 0    for x in A:        if x.key > max_key:            max_key = x.key    u = max_key + 1 # 直接访问数组的大小    print(f"最大键值: {max_key}, 直接访问数组D的大小: {u}")    # 步骤二：构建直接访问数组    # 创建一个大小为u的数组D，并用None填充。    # O(u) 空间复杂度。    D = [None] * u    print(f"初始化直接访问数组D (大小 {u}): {D}")    # 步骤三：插入数据项    # 遍历输入数组A中的每个数据项x，将其完整地放入D中以x.key为索引的位置。    # O(n) 时间复杂度。    print("n--- 插入数据项到D ---")    for x in A:        D[x.key] = x        print(f"插入 {x} 到 D[{x.key}]")    print(f"插入后的D: {D}")    # 步骤四：有序提取    # 初始化一个计数器i，用于跟踪A中下一个可插入的位置。    i = 0    print("n--- 从D有序提取数据项 ---")    # 遍历直接访问数组D从索引0到u-1。    # O(u) 时间复杂度。    for key in range(u):        # 检查当前索引key处是否有实际的数据项（即不是None）。        if D[key] is not None:            # 如果有数据项，将其按顺序放回原始数组A。            A[i] = D[key]            print(f"从 D[{key}] 提取 {D[key]} 到 A[{i}]")            # 递增计数器，为下一个有序项准备。            i += 1    print(f"排序完成后的A: {A}")    return A# 示例数据：假设我们有一组人员，以身高（厘米）作为键进行排序# 这里我们只关注key，value可以是一个占位符input_data = [    Item(key=160, value="Alice"),    Item(key=150, value="Bob"),    Item(key=200, value="Charlie"),    Item(key=188, value="David")]print("原始输入数组 A:", input_data)sorted_data = direct_access_sort(input_data)print("最终排序结果 A:", sorted_data)

运行上述代码，我们将看到以下详细的执行过程：

原始输入数组 A: [{key: 160, value: ‘Alice’}, {key: 150, value: ‘Bob’}, {key: 200, value: ‘Charlie’}, {key: 188, value: ‘David’}]

步骤一：确定键值范围

遍历 A，找到最大键为 200。因此，u = 200 + 1 = 201。直接访问数组 D 的大小将是 201。

步骤二：构建直接访问数组

创建一个包含 201 个 None 的数组 D。D = [None, None, …, None] (共201个)

步骤三：插入数据项

x = {key: 160, value: ‘Alice’} -> D[160] = {key: 160, value: ‘Alice’}x = {key: 150, value: ‘Bob’} -> D[150] = {key: 150, value: ‘Bob’}x = {key: 200, value: ‘Charlie’} -> D[200] = {key: 200, value: ‘Charlie’}x = {key: 188, value: ‘David’} -> D[188] = {key: 188, value: ‘David’}此时，D 中只有 D[150], D[160], D[188], D[200] 存储了实际数据，其余位置仍为 None。

步骤四：有序提取

i = 0遍历 key 从 0 到 200：当 key = 150 时，D[150] 不为 None。将 {key: 150, value: ‘Bob’} 赋给 A[0]。i 变为 1。当 key = 160 时，D[160] 不为 None。将 {key: 160, value: ‘Alice’} 赋给 A[1]。i 变为 2。当 key = 188 时，D[188] 不为 None。将 {key: 188, value: ‘David’} 赋给 A[2]。i 变为 3。当 key = 200 时，D[200] 不为 None。将 {key: 200, value: ‘Charlie’} 赋给 A[3]。i 变为 4。其他 key 值处 D[key] 均为 None，跳过。

最终排序结果 A: [{key: 150, value: ‘Bob’}, {key: 160, value: ‘Alice’}, {key: 188, value: ‘David’}, {key: 200, value: ‘Charlie’}]。可以看到，原始的复杂对象（包含键和值）已经根据键的顺序成功排序。

适用场景与注意事项

适用场景

键为唯一非负整数: 这是该算法最基本且严格的要求。如果键不唯一，则需要额外的处理（如链表存储冲突），这会使其退化为桶排序或哈希表。键的范围相对较小: 当键的最大值 u 与数据项数量 n 相近时，直接访问数组排序的效率非常高。其时间复杂度为 O(n + u)，空间复杂度为 O(u)。在理想情况下（u ≈ n），它可以达到线性的 O(n) 时间复杂度。

注意事项与局限性

键的唯一性: 如果键不唯一，D[x.key] = x 操作会覆盖掉相同键的先前数据项，导致数据丢失。键的非负性: 数组索引不能为负数。键的整数性: 数组索引必须是整数。空间效率: 当键的范围 u 远大于数据项的数量 n 时，会造成大量的空间浪费。例如，如果只有10个数据项，但它们的键值分布在0到1,000,000之间，那么 D 数组将需要1,000,001个位置，其中绝大部分是空的，这在内存上是不可接受的。时间效率: 即使空间不是问题，当 u 远大于 n 时，最后一步的遍历 D 的操作也会变得非常耗时，导致 O(n+u) 的时间复杂度中的 u 部分占据主导，性能下降。与计数排序/基数排序的联系: 直接访问数组排序可以看作是计数排序的一种简化形式，尤其是在键值本身就是我们需要排序的唯一属性时。它也是基数排序的基础之一，基数排序通过多次直接访问数组排序来处理多位数键。

总结

直接访问数组排序是一种简洁高效的排序算法，尤其适用于键值范围有限且键为唯一非负整数的特定场景。它通过将键作为直接索引，实现了对完整数据项的快速定位和有序重构。然而，其对键的严格要求以及在键值范围过大时可能导致的巨大空间和时间开销，限制了其普适性。理解其工作原理和局限性，有助于在合适的场景中选择并应用这一强大的排序技术。

以上就是深入理解直接访问数组排序：原理与实现的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1381202.html

access python 排序算法数据丢失

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

SymPy符号在函数默认参数中的陷阱与解决方案：理解对象同一性

上一篇 2025年12月14日 22:45:40

Pytest测试Python input()函数提示信息的高效策略

下一篇 2025年12月14日 22:45:55

好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
2000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
2000
好文分享

正则表达式在文本验证中的常见问题有哪些？

正则表达式助力文本输入验证在文本输入框的验证中，经常遇到需要限定输入内容的情况。例如，输入框只能输入整数，第一位可以为负号。对于不会使用正则表达式的人来说，这可能是个难题。下面我们将提供三种正则表达式，分别满足不同的验证要求。 1. 可选负号，任意数量数字如果输入框中允许第一位为负号，后面可输入…

程序猿
2025年12月24日
0000
使用 React 构建 Fylo 云存储网站

介绍在这篇博文中，我们将逐步介绍如何使用 react 创建一个功能丰富的云存储网站。该网站受 fylo 启发，提供了主页、功能、工作原理、感言和页脚等部分。在此过程中，我们将讨论用于构建这个完全响应式网站的结构、组件和样式。项目概况该项目由多个部分组成，旨在展示云存储服务。每个部分都是用 re…

程序猿
2025年12月24日 • 好文分享
0000
使用 React 构建食谱查找器网站

介绍在本博客中，我们将使用 react 构建一个食谱查找网站。该应用程序允许用户搜索他们最喜欢的食谱，查看趋势或新食谱，并保存他们最喜欢的食谱。我们将利用 edamam api 获取实时食谱数据并将其动态显示在网站上。项目概况食谱查找器允许用户：按名称搜索食谱。查看趋势和新添加的食谱。查看各…

程序猿
2025年12月24日 • 好文分享
2000
好文分享

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
0000
好文分享

姜戈顺风

本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

程序猿
2025年12月24日
0000
好文分享

不可变数据结构：ECMA 4 中的记录和元组

不可变数据结构：ecmascript 2024 中的新功能 ecmascript 2024 引入了几个令人兴奋的更新，但对我来说最突出的一个功能是引入了不可变数据结构。这些新结构——记录和元组——改变了 javascript 中数据管理的游戏规则。它们提供了一种令人满意的方式来保持我们的数据健全、安…

程序猿
2025年12月24日
1000
好文分享

花 $o 学习这些编程语言或免费

→ Python → JavaScript → Java → C# → 红宝石 → 斯威夫特 → 科特林 → C++ → PHP → 出发 → R → 打字稿 []https://x.com/e_opore/status/1811567830594388315?t=_j4nncuiy2wfbm7ic…

程序猿
2025年12月24日
0000
好文分享

深度剖析程序设计中必不可少的数据类型分类

【深入解析基本数据类型：掌握编程中必备的数据分类】在计算机编程中，数据是最为基础的元素之一。数据类型的选择对于编程语言的使用和程序的设计至关重要。在众多的数据类型中，基本数据类型是最基础、最常用的数据分类之一。通过深入解析基本数据类型，我们能够更好地掌握编程中必备的数据分类。一、基本数据类型的定…

程序猿
2025年12月24日
0000
好文分享

html5怎么导视频_html5用video标签导出或Canvas转DataURL获视频【导出】

HTML5无法直接导出video标签内容，需借助Canvas捕获帧并结合MediaRecorder API、FFmpeg.wasm或服务端协同实现。MediaRecorder适用于WebM格式前端录制；FFmpeg.wasm支持MP4等格式及精细编码控制；服务端方案适合高负载场景。如果您希望在网页…

程序猿
2025年12月23日
3000
好文分享

如何查看编写的html_查看自己编写的HTML文件效果【效果】

要查看HTML文件的浏览器渲染效果，需确保文件以.html为扩展名保存、用浏览器直接打开、利用开发者工具调试、必要时启用本地HTTP服务器、或使用编辑器实时预览插件。如果您编写了HTML代码，但无法直观看到其在浏览器中的实际渲染效果，则可能是由于文件未正确保存、未使用浏览器打开或文件扩展名设置错误…

程序猿
2025年12月23日
4000
好文分享

html5怎么加php_html5用Ajax与PHP后端交互实现数据传递【交互】

HTML5不能直接运行PHP，需通过Ajax与PHP通信：前端用fetch发送请求，PHP接收处理并返回JSON，前端解析响应更新DOM；注意跨域、编码、CSRF防护和输入过滤。 HTML5 本身是前端标记语言，不能直接运行 PHP 代码，但可以通过 Ajax（异步 JavaScript）与 PHP…

程序猿
2025年12月23日
3000
好文分享

html5怎么打包运行_HT5用Webpack或Gulp打包后浏览器打开运行【打包】

应通过 HTTP 服务运行打包后的 HTML5 页面，而非双击打开：一、Webpack 配 webpack-dev-server 启动本地服务；二、Gulp 配 BrowserSync 提供实时重载；三、用 Python/Node.js 轻量 HTTP 工具托管 dist 目录；四、仅当必须双击运行…

程序猿
2025年12月23日
0000
好文分享

html5文件运行不出来怎么回事_析html5文件运行失败原因【解析】

首先检查文件扩展名和编码格式，确保为.html且使用UTF-8编码；接着验证HTML5结构完整性，包含及正确闭合的标签；然后排查外部资源路径是否正确，利用开发者工具查看404错误；排除浏览器兼容性问题，优先在现代浏览器中测试并避免未广泛支持的API；检查JavaScript语法错误与执行顺序，确保脚…

程序猿
2025年12月23日
0000
好文分享

html5怎么插入文档_HT5用object或iframe嵌入PDF/Word文档显示【插入】

可在HTML5中用iframe或object标签嵌入PDF，需设宽高及可访问路径；Word文档需借OneDrive等第三方服务代理渲染；须处理跨域限制并提供下载降级方案。如果您希望在HTML5页面中嵌入PDF或Word文档并直接显示，可以使用或标签实现。以下是几种可行的嵌入方法：一、使用ifra…

程序猿
2025年12月23日
2000
好文分享

如何运行html代码_html代码运行方法【步骤】

HTML代码需保存为.html文件并用浏览器打开才能正确显示；若含AJAX或外部资源则需本地服务器；临时测试可用开发者工具；在线编辑器支持即时预览。如果您编写了一段HTML代码，但无法在浏览器中正确显示效果，则可能是由于文件未以正确的格式保存或未通过浏览器打开。以下是运行HTML代码的具体步骤： …

程序猿
2025年12月23日
0000
好文分享

html5框架怎么设置_html5用iframe或div框架集嵌入子页面搭整体结构【设置】

HTML5中应使用iframe、div+CSS、object或Web Components替代已废弃的frameset/frame；iframe支持同源嵌入，div+CSS结合JavaScript可动态加载内容，object提供降级支持，Web Components实现可复用嵌入。如果您希望使用 …

程序猿
2025年12月23日
0000
好文分享

safari怎么打开html5_Safari浏览器直接输入html5链接自动渲染打开【打开】

Safari中正确渲染HTML5内容需采用file://协议、禁用本地限制、启用HTTP服务器或更新版本并开启实验性功能。具体包括：一、用file:///绝对路径打开本地HTML文件；二、勾选高级设置中的“显示开发菜单”并禁用本地文件限制；三、用Python启动本地HTTP服务，通过http://l…

程序猿
2025年12月23日
0000
好文分享

html5乱码怎么设置_html5用meta charset=utf-8设编码防页面乱码【设置】

HTML5中文乱码需四步解决：一、在首行添加如果您在浏览 HTML5 页面时遇到中文显示为乱码的情况，则可能是由于网页未正确声明字符编码。以下是解决此问题的步骤：一、在 head 中添加 meta charset 声明 HTML5 推荐使用 meta charset=”UTF-8&#…

程序猿
2025年12月23日
0000