优化滑动窗口中位数：使用延迟删除和双堆方法解决Python TLE问题

程序猿 • 2025年12月14日 14:37:23 • 好文分享 • 阅读 0

本文深入探讨了滑动窗口中位数问题，并针对传统双堆方法中因低效移除操作导致的超时（TLE）问题，提出了一种基于延迟删除策略的优化方案。通过将元素与索引绑定并利用自定义堆实现，该方案避免了昂贵的O(K)移除操作，将时间复杂度从O(NK)有效降低至O(N log K)，从而在大规模数据集上实现了高性能。

1. 问题概述：滑动窗口中位数

滑动窗口中位数问题要求在一个整数数组 nums 上，维护一个大小为 k 的滑动窗口。当窗口从左向右移动时，每次移动一个位置，都需要计算并返回当前窗口内的中位数。中位数是排序后位于中间的那个数；如果窗口大小 k 是偶数，则中位数是中间两个数的平均值。

例如，对于 nums = [1,3,-1,-3,5,3,6,7] 和 k = 3：

窗口 [1,3,-1]，中位数是 1窗口 [3,-1,-3]，中位数是 -1…依此类推

2. 传统双堆方法的性能瓶颈

解决滑动窗口中位数问题的一个常见且高效的思路是使用两个堆（一个最大堆 small 存储较小的一半元素，一个最小堆 large 存储较大的一半元素）。通过维护这两个堆，可以O(1)或O(log K)地获取中位数，并在O(log K)时间内添加新元素。

然而，当需要从窗口中“移除”一个旧元素时，问题就出现了。原始代码中的 popNum 方法采用了以下逻辑：

def popNum(self, num):    if num > (self.small[0] * -1): # 假设small[0]是最大堆的堆顶，其真实值是负数        self.large.remove(num)        heapq.heapify(self.large)    else:        self.small.remove(num * -1)        heapq.heapify(self.small)    self.balance()

这里的瓶颈在于 list.remove(num) 和 heapq.heapify(heap)。

立即学习“Python免费学习笔记（深入）”；

list.remove(num)：在Python列表中查找并移除一个元素的时间复杂度是O(N)，其中N是列表的当前大小（在这里是K）。heapq.heapify(heap)：在移除元素后，堆的结构被破坏，需要调用 heapify 来重新构建堆，其时间复杂度也是O(N)（或O(K)）。

因此，每次移除操作的复杂度高达O(K)。在一个包含 N 个元素的数组上进行 N-K+1 次窗口滑动，每次滑动都涉及一次移除和一次添加，导致总时间复杂度飙升至 O(NK)。当 N=100000 且 K=50000 时，`NK的量级将达到5 * 10^9`，这远远超出了通常的计算限制，从而导致“时间限制超出”（TLE）错误。

3. 优化的双堆方法：延迟删除策略

为了解决移除操作的效率问题，我们可以采用“延迟删除”（Lazy Deletion）策略。这种方法的核心思想是：当一个元素离开窗口时，我们不立即从堆中物理删除它，而是对其进行“标记”。当我们需要从堆中获取元素（如peek或pop）时，如果遇到已标记为“删除”的元素，就跳过它，直到找到一个有效元素。

实现延迟删除需要解决几个关键问题：

唯一标识元素： 窗口中可能存在重复的数值。为了区分它们，我们需要将每个元素与其在原始数组中的索引绑定，形成 (值, 索引) 对。例如，[1, 5, 1] 中有两个 1，通过 (1, 0) 和 (1, 2) 可以区分。标记删除： 如何高效地标记一个元素为“已删除”？最简单的方法是维护一个窗口的起始索引 lowindex。任何 (值, 索引) 对中，如果索引 自定义堆封装： Python的 heapq 模块提供了堆的基本操作，但不支持延迟删除。我们需要封装 heapq，创建自定义的堆类来处理 (值, 索引) 对和延迟删除逻辑。

4. 核心实现细节

我们将构建两个自定义的堆类：MinWindowHeap（最小堆）和 MaxWindowHeap（最大堆），以及一个 Solution 类来协调它们。

4.1 自定义堆结构：MinWindowHeap 和 MaxWindowHeap

这两个类将封装 heapq 的功能，并添加延迟删除的逻辑。

MinWindowHeap (最小堆):

__init__(self, conv=lambda x: x): 初始化内部列表 self.heap。conv 是一个转换函数，用于处理元素入堆时的形式（例如，MaxWindowHeap 会用它来取反值）。self.lowindex 记录当前窗口的起始索引。peek(self): 这是延迟删除的关键。它会循环检查堆顶元素：如果堆顶元素的索引小于 self.lowindex，说明该元素已过期，将其弹出并继续检查下一个堆顶元素，直到找到一个有效的（未过期的）元素或者堆为空。push(self, item): 将 item（(值, 索引) 对）通过 conv 函数转换后推入堆。pop(self): 先调用 peek() 确保获取到的是有效堆顶，然后从 self.heap 中实际弹出该元素。

MaxWindowHeap (最大堆):

继承自 MinWindowHeap。__init__(self): 调用 super().__init__(negate)，其中 negate 函数用于将 (值, 索引) 对的值取反，从而将 heapq 的最小堆行为模拟成最大堆。

4.2 Solution 类中的核心逻辑

Solution 类将协调 small (MaxWindowHeap) 和 large (MinWindowHeap) 两个堆，实现滑动窗口中位数的功能。

rebalance(self, add):

维护一个 self.balance 计数器，表示 large 堆比 small 堆多出的元素数量（或负数表示 small 堆多出）。当 abs(self.balance) 大于1时，说明两个堆不平衡，需要将一个堆的顶部元素移动到另一个堆，直到平衡。此方法在每次插入或逻辑删除元素后被调用。

insert(self, item):

item 是 (值, 索引) 对。根据 item 的值与 large 堆的堆顶元素比较，决定将其插入 small 堆还是 large 堆。插入后调用 rebalance 保持堆的平衡。

remove(self, item):

item 是 (值, 索引) 对，表示要移除的旧元素。关键优化： 它不实际从堆中移除元素，而是通过更新 self.large.lowindex 和 self.small.lowindex 为 item[1] + 1 来标记所有索引小于等于 item[1] 的元素为“过期”。然后调用 rebalance 来调整平衡计数。

getMedian(self):

根据 self.balance 的值和两个堆的堆顶元素（通过 peek() 获取有效元素）来计算当前窗口的中位数。如果 balance 为0，取两个堆顶的平均值；否则取元素较多那个堆的堆顶。

medianSlidingWindow(self, nums, k):

主函数，用于解决问题。首先将 nums 转换为 (值, 索引) 对的列表 items。初始化 small 和 large 堆，并用前 k 个元素填充第一个窗口。计算第一个窗口的中位数并添加到结果列表。然后通过循环滑动窗口：zip(items, items[k:]) 用于同时获取离开窗口的 olditem 和进入窗口的 item。对 olditem 调用 remove()，对 item 调用 insert()。每次滑动后计算当前窗口的中位数并添加到结果。

5. 完整解决方案代码

import heapq# 辅助函数：将 (值, 索引) 对的值取反，用于模拟最大堆def negate(item):    return -item[0], item[1]class MinWindowHeap(object):    def __init__(self, conv=lambda x: x):        self.heap = []        self.conv = conv  # 转换函数 (例如，用于MaxHeap取反值)        self.lowindex = 0  # 窗口下限索引，用于识别已删除项    def peek(self):  # 返回 (值, 索引) 或 None (如果堆为空或仅包含已删除项)        while self.heap:            # 转换堆顶元素，例如 MaxWindowHeap 会将值取反            item = self.conv(self.heap[0])             if item[1] >= self.lowindex: # 如果索引在当前窗口内，则有效                return item            # 元素已过期（索引小于lowindex），从堆中弹出            heapq.heappop(self.heap)        return None # 堆中没有有效元素    def push(self, item):        # 将 (值, 索引) 对通过转换函数推入堆        heapq.heappush(self.heap, self.conv(item))    def pop(self):        item = self.peek()  # 获取有效堆顶，同时清除所有过期的堆顶        if item:            heapq.heappop(self.heap) # 实际弹出有效堆顶        return item # 返回被弹出的有效元素class MaxWindowHeap(MinWindowHeap):    def __init__(self):        # Python 3 中 super() 可以不带参数        super(MaxWindowHeap, self).__init__(negate) # 使用negate函数将最小堆模拟为最大堆class Solution(object):    def rebalance(self, add):        """        调整两个堆的平衡。        add > 0 表示 large 堆增加了元素，或 small 堆移除了元素。        add < 0 表示 small 堆增加了元素，或 large 堆移除了元素。        """        self.balance += add        if abs(self.balance)  1: # large 堆元素过多，需要移动一个到 small 堆            self.small.push(self.large.pop())        elif self.balance = pivot[0])        heap = self.large if islarge else self.small        heap.push(item)        # 更新平衡计数并重新平衡        self.rebalance(1 if islarge else -1)    def remove(self, item):        """        逻辑删除一个元素（通过更新 lowindex 标记过期）并调整平衡。        item 是 (值, 索引) 对，表示离开窗口的旧元素。        """        # 获取 large 堆的堆顶作为枢轴        pivot = self.large.peek()        # 判断旧元素是属于 large 堆还是 small 堆        islarge = (pivot is not None) and (item[0] >= pivot[0])        # 关键步骤：更新两个堆的 lowindex，标记所有索引小于等于 item[1] 的元素为过期        # 这意味着窗口向右移动了，item[1] 及其之前的所有元素都可能已过期        self.large.lowindex = self.small.lowindex = item[1] + 1        # 更新平衡计数并重新平衡        self.rebalance(-1 if islarge else 1)    def getMedian(self):        """        获取当前窗口的中位数。        """        if self.balance == 0: # 两个堆大小相同，中位数是两个堆顶的平均值            return (self.large.peek()[0] + self.small.peek()[0]) * 0.5        # 否则，元素较多的那个堆的堆顶就是中位数        return self.large.peek()[0] if self.balance > 0 else self.small.peek()[0]    def medianSlidingWindow(self, nums, k):        """        滑动窗口中位数的主函数。        :type nums: List[int]        :type k: int        :rtype: List[float]        """        self.small = MaxWindowHeap() # 存储较小一半元素的堆 (最大堆)        self.large = MinWindowHeap() # 存储较大一半元素的堆 (最小堆)        self.balance = 0             # 记录 large 堆与 small 堆的元素数量差        # 将原始数组转换为 (值, 索引) 对，以便唯一标识元素        items = [(val, i) for i, val in enumerate(nums)]        # 填充第一个窗口        for item in items[:k]:            self.insert(item)        result = [self.getMedian()] # 记录第一个窗口的中位数        # 滑动窗口        # olditem 是离开窗口的元素，item 是进入窗口的元素        for olditem, item in zip(items, items[k:]):            self.remove(olditem) # 逻辑删除旧元素            self.insert(item)    # 插入新元素            result.append(self.getMedian()) # 计算并记录当前窗口的中位数        return result

6. 注意事项与总结

时间复杂度优化： 通过延迟删除策略，remove 操作不再需要遍历列表或重建堆。更新 lowindex 是 O(1) 操作。peek 和 pop 操作在遇到过期元素时，每次弹出都是 O(log K)，但每个元素只会因过期而被弹出一次。因此，平均来看，insert、remove 和 getMedian 的操作都保持在 O(log K)。整个算法的时间复杂度从 O(N*K) 优化到了 O(N log K)，在大规模数据集上性能显著提升。空间复杂度： 两个堆最多存储 K 个 (值, 索引) 对，所以空间复杂度为 O(K)。处理重复值： 将值与索引绑定 (值, 索引) 是处理数组中重复值的关键，确保每个元素都能被唯一标识和跟踪。Python heapq 模块： heapq 默认是最小堆。为了实现最大堆，我们通过存储元素的负值来实现。平衡维护： rebalance 方法确保 small 和 large 两个堆的大小差异不超过1，这是高效获取中位数的基础。

这种优化的双堆方法提供了一个健壮且高效的解决方案，适用于处理大规模数据下的滑动窗口中位数问题。它巧妙地利用了堆的特性和延迟删除机制，避免了传统方法中的性能瓶颈。

以上就是优化滑动窗口中位数：使用延迟删除和双堆方法解决Python TLE问题的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1374986.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

在 CPU 上运行任何量化的 GGUF 模型进行本地推理的教程

上一篇 2025年12月14日 14:37:08

Python实现弗洛伊德三角形：从基础到优化

下一篇 2025年12月14日 14:37:31

好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
2000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
2000
好文分享

正则表达式在文本验证中的常见问题有哪些？

正则表达式助力文本输入验证在文本输入框的验证中，经常遇到需要限定输入内容的情况。例如，输入框只能输入整数，第一位可以为负号。对于不会使用正则表达式的人来说，这可能是个难题。下面我们将提供三种正则表达式，分别满足不同的验证要求。 1. 可选负号，任意数量数字如果输入框中允许第一位为负号，后面可输入…

程序猿
2025年12月24日
0000
好文分享

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
0000
好文分享

姜戈顺风

本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

程序猿
2025年12月24日
0000
好文分享

花 $o 学习这些编程语言或免费

→ Python → JavaScript → Java → C# → 红宝石 → 斯威夫特 → 科特林 → C++ → PHP → 出发 → R → 打字稿 []https://x.com/e_opore/status/1811567830594388315?t=_j4nncuiy2wfbm7ic…

程序猿
2025年12月24日
0000
好文分享

应对性能瓶颈：前端工程师的重绘与回流解决方案

重绘和回流解密：前端工程师如何应对性能瓶颈引言：随着互联网的快速发展，前端工程师的角色越来越重要。他们需要处理用户界面的设计和开发，同时还要关注网站性能的优化。在前端性能优化中，重绘和回流是常见的性能瓶颈。本文将详细介绍重绘和回流的原理，并提供一些实用的代码示例，帮助前端工程师应对性能瓶颈。一、…

程序猿
2025年12月24日
2000
好文分享

响应式HTML5按钮适配不同屏幕方法【方法】

实现响应式HTML5按钮需五种方法：一、CSS媒体查询按max-width断点调整样式；二、用rem/vw等相对单位替代px；三、Flexbox控制容器与按钮伸缩；四、CSS变量配合requestAnimationFrame优化的JS动态适配；五、Tailwind等框架的响应式工具类。如果您希望H…

程序猿
2025年12月23日
0000
好文分享

html5怎么导视频_html5用video标签导出或Canvas转DataURL获视频【导出】

HTML5无法直接导出video标签内容，需借助Canvas捕获帧并结合MediaRecorder API、FFmpeg.wasm或服务端协同实现。MediaRecorder适用于WebM格式前端录制；FFmpeg.wasm支持MP4等格式及精细编码控制；服务端方案适合高负载场景。如果您希望在网页…

程序猿
2025年12月23日
3000
好文分享

如何查看编写的html_查看自己编写的HTML文件效果【效果】

要查看HTML文件的浏览器渲染效果，需确保文件以.html为扩展名保存、用浏览器直接打开、利用开发者工具调试、必要时启用本地HTTP服务器、或使用编辑器实时预览插件。如果您编写了HTML代码，但无法直观看到其在浏览器中的实际渲染效果，则可能是由于文件未正确保存、未使用浏览器打开或文件扩展名设置错误…

程序猿
2025年12月23日
4000
好文分享

html5怎么加php_html5用Ajax与PHP后端交互实现数据传递【交互】

HTML5不能直接运行PHP，需通过Ajax与PHP通信：前端用fetch发送请求，PHP接收处理并返回JSON，前端解析响应更新DOM；注意跨域、编码、CSRF防护和输入过滤。 HTML5 本身是前端标记语言，不能直接运行 PHP 代码，但可以通过 Ajax（异步 JavaScript）与 PHP…

程序猿
2025年12月23日
3000
好文分享

html5 js怎么加_html5用script标签内嵌或外链引入JS代码【添加】

在HTML5中执行JavaScript需通过script标签：一、内联编写于head或body中；二、外链引入.js文件并建议放body末尾或加defer；三、defer按序执行，async独立执行；四、可动态创建script元素插入执行。如果您希望在HTML5页面中执行JavaScript代码，…

程序猿
2025年12月23日
0000
好文分享

node.js怎么运行html_node.js运行html步骤【指南】

答案是使用Node.js内置http模块、Express框架或第三方工具serve可快速搭建服务器预览HTML文件。首先通过http模块创建服务器并读取index.html返回响应；其次用Express初始化项目并配置静态文件服务；最后利用serve工具全局安装后一键启动服务器，三种方式均在浏览器访…

程序猿
2025年12月23日
3000
好文分享

html5能否插入带表单的文档_html5表单文档嵌入与数据提交【步骤】

HTML5中无法直接嵌入外部带表单的HTML文档并原生提交；可行方案有四：一、用iframe嵌入，需同源或CORS支持，并用postMessage通信；二、用fetch+DOMParser动态加载表单片段并手动绑定事件；三、在当前页面直接编写表单，最规范且兼容性好；四、用JavaScript+fet…

程序猿
2025年12月23日
0000
好文分享

HTML5怎么制作广告_HTML5用动画与交互制横幅或弹窗广告吸引点击【制作】

可利用HTML5结合CSS3动画、Canvas、Web Animations API、Intersection Observer和video标签制作互动广告：一用@keyframes实现横幅入场动画；二用Canvas绘制并响应悬停；三用Web Animations API控制弹窗时序；四用Inter…

程序猿
2025年12月23日
0000
html5怎么引用js_HTML5用外链或内嵌JS代码引用脚本【引用】

HTML5中执行JavaScript需通过外链或内嵌方式引入：一、外链用，支持defer/async；二、内嵌将代码写入间，推荐置于body底部；三、type属性默认可省略；四、模块化使用type=”module”支持ES6 import/export。 <img sr…

程序猿
好文分享 2025年12月23日
0000
好文分享

360怎么装html5_360浏览器默认支持HTML5无需额外安装设置【说明】

HTML5是网页标准，非独立软件，360浏览器7.0+已原生支持；需确认内核为Blink/Chromium、关闭兼容模式、禁用强制兼容策略、重置Flash插件、清除HTML5本地存储、检查系统Media Foundation组件。如果您在使用360浏览器时发现HTML5网页功能异常（如视频无法播放…

程序猿
2025年12月23日
0000
好文分享

html5怎么打包运行_HT5用Webpack或Gulp打包后浏览器打开运行【打包】

应通过 HTTP 服务运行打包后的 HTML5 页面，而非双击打开：一、Webpack 配 webpack-dev-server 启动本地服务；二、Gulp 配 BrowserSync 提供实时重载；三、用 Python/Node.js 轻量 HTTP 工具托管 dist 目录；四、仅当必须双击运行…

程序猿
2025年12月23日
0000
好文分享

html5文件运行不出来怎么回事_析html5文件运行失败原因【解析】

首先检查文件扩展名和编码格式，确保为.html且使用UTF-8编码；接着验证HTML5结构完整性，包含及正确闭合的标签；然后排查外部资源路径是否正确，利用开发者工具查看404错误；排除浏览器兼容性问题，优先在现代浏览器中测试并避免未广泛支持的API；检查JavaScript语法错误与执行顺序，确保脚…

程序猿
2025年12月23日
0000
好文分享

html5怎么跳出页面_HT5用location.href或a标签实现页面跳转跳出【跳出】

HTML5页面跳转有五种方法：一、location.href直接跳转并替换历史；二、location.replace()跳转且不保留当前页历史；三、a标签href跳转，支持新窗口及历史回退；四、a标签+JavaScript事件控制条件跳转；五、meta refresh实现定时自动跳转。如果您希望在…

程序猿
2025年12月23日
2000