LeetCode K个高频元素：桶排序算法与关键细节解析

程序猿 • 2025年11月4日 23:40:55 • 用户投稿 • 阅读 1

本文深入探讨了“k个高频元素”问题的桶排序解法。通过使用哈希映射统计元素频率，并利用数组作为桶（索引为频率，存储对应频率的元素列表），该方法能高效找出前k个出现频率最高的元素。文章着重分析了在填充桶时遍历哈希映射的键集（`keyset()`）而非原始数组的重要性，以确保桶中元素唯一性，避免结果错误。

在算法设计中，高效地从一组数据中找出出现频率最高的K个元素是一个常见且重要的任务。LeetCode上的“K个高频元素”问题正是对此类场景的典型考量。本文将详细介绍一种基于哈希映射（HashMap）和桶排序（Bucket Sort）的解决方案，并特别强调在实现过程中一个关键的细节——如何正确地填充桶。

算法核心思想

解决“K个高频元素”问题通常可以分为两个主要阶段：

频率统计： 首先，我们需要遍历输入数组 nums，统计每个数字出现的频率。这可以通过使用一个哈希映射（HashMap）来实现，其中键是数组中的数字，值是该数字出现的次数。桶排序与结果收集： 接下来，我们创建一个“桶”结构，通常是一个 List[] 数组。这个数组的索引代表元素的频率，而每个索引处存储的 List 则包含所有具有该频率的数字。例如，bucket[2] 将存储所有出现频率为2的数字。由于我们希望找到频率最高的K个元素，我们可以从桶数组的末尾（即最高频率）开始向前遍历，依次收集元素，直到收集到K个为止。

频率统计阶段

这一阶段相对直观。我们初始化一个 HashMap，然后遍历输入数组 nums。对于 nums 中的每一个数字 n，我们更新其在 map 中的频率。如果 n 首次出现，其频率初始化为1；否则，在原有频率上加1。

// the frequency of each element stored in map. var map = new HashMap(); for(int n : nums) {    map.put(n, map.getOrDefault(n, 0) + 1); }

桶排序阶段：填充桶的关键细节

在频率统计完成后，我们需要将这些数字根据它们的频率放入对应的桶中。这一步是整个算法中一个容易出错但至关重要的环节。

桶的定义如下：List[] bucket = new ArrayList[nums.length + 1];。这里的 nums.length + 1 是因为频率的最大值可能等于 nums.length（当所有元素都相同时），所以需要一个足够大的数组来容纳所有可能的频率作为索引。

现在，问题来了：我们应该遍历 nums 数组还是 map.keySet() 来填充桶？

为什么必须遍历 map.keySet()

正确的做法是遍历 map.keySet()。map.keySet() 返回的是哈希映射中所有唯一的键（即输入数组中所有不重复的数字）。对于每一个唯一的数字 n，我们获取其在 map 中对应的频率 freq，然后将 n 添加到 bucket[freq] 对应的列表中。

// 正确的填充桶方式for(int n : map.keySet()) { // 遍历唯一的数字    int freq = map.get(n);    if(bucket[freq] == null) {        bucket[freq] = new ArrayList();     }    bucket[freq].add(n); }

原因分析：桶 bucket[freq] 应该存储的是“所有出现频率为 freq 的唯一数字”。题目要求返回的是K个不同的高频元素。如果 bucket[freq] 中包含了重复的数字，那么在后续收集结果时，我们会错误地将同一个数字多次计入结果，或者导致最终结果包含非去重元素，从而不符合题目要求。

map.keySet() 保证了我们每次处理的都是一个唯一的数字。例如，如果输入是 [1, 1, 2, 2, 3]，map 会是 {1:2, 2:2, 3:1}。遍历 map.keySet() 时，我们会依次处理 1、2、3。

存了个图

视频图片解析/字幕/剪辑，视频高清保存/图片源图提取

17 查看详情对于 1 (freq=2)，bucket[2] 中添加 1。对于 2 (freq=2)，bucket[2] 中添加 2。对于 3 (freq=1)，bucket[1] 中添加 3。最终 bucket[2] 包含 [1, 2]，bucket[1] 包含 [3]，完美符合预期。

为什么不能遍历 nums 数组

如果尝试遍历原始的 nums 数组来填充桶，将会导致错误的结果：

// 错误的填充桶方式for(int n : nums) { // 遍历原始数组，可能包含重复数字    int freq = map.get(n);    if(bucket[freq] == null) {        bucket[freq] = new ArrayList();     }    bucket[freq].add(n); }

错误分析：继续使用 [1, 1, 2, 2, 3] 的例子。

第一次遇到 1 (freq=2)，bucket[2] 中添加 1。第二次遇到 1 (freq=2)，bucket[2] 中再次添加 1。第一次遇到 2 (freq=2)，bucket[2] 中添加 2。第二次遇到 2 (freq=2)，bucket[2] 中再次添加 2。遇到 3 (freq=1)，bucket[1] 中添加 3。最终 bucket[2] 可能会变成 [1, 1, 2, 2]。当我们在收集结果时，如果 k=2，我们从 bucket[2] 中取出 1 和 1，这显然是错误的，因为 1 应该只被计作一个不同的高频元素。bucket 中的每个 List 应该只包含唯一的数字。

完整代码示例

结合上述分析，以下是“K个高频元素”问题的完整Java解决方案：

import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;class Solution {    public int[] topKFrequent(int[] nums, int k) {        // 1. 频率统计：使用HashMap统计每个数字的出现频率        Map map = new HashMap();         for(int n : nums) {            map.put(n, map.getOrDefault(n, 0) + 1);         }        // 2. 桶排序：创建一个List数组作为桶，索引代表频率        // 桶的长度为 nums.length + 1，因为最大频率可能等于 nums.length        List[] bucket = new ArrayList[nums.length + 1];         // 3. 填充桶：遍历map的keySet()，将唯一的数字根据其频率放入对应的桶中        // 这一步是关键，确保桶中存储的是唯一的数字        for(int n : map.keySet()) {            int freq = map.get(n);            if(bucket[freq] == null) {                bucket[freq] = new ArrayList();             }            bucket[freq].add(n);         }        // 4. 收集结果：从频率最高的桶开始逆序遍历，收集前K个元素        int[] result = new int[k];        int resultIndex = 0; // 用于填充结果数组的索引        // 从最高频率（bucket.length - 1）开始向下遍历        for(int i = bucket.length - 1; i >= 0; i--) {            if(bucket[i] != null) { // 如果当前频率的桶不为空                for(int element : bucket[i]) { // 遍历桶中的每个元素                    result[resultIndex++] = element;                    if(resultIndex == k) { // 如果已收集到K个元素，则返回                        return result;                     }                }            }        }        return result; // 理论上不会执行到这里，因为题目保证K是有效的    }}

注意事项与总结

时间复杂度：

频率统计（HashMap）：遍历 nums 数组一次，O(N)，其中 N 是 nums 的长度。填充桶：遍历 map.keySet()，最多有 N 个不同的元素，每次操作 O(1)，所以也是 O(N)。结果收集：最坏情况下，可能需要遍历所有桶和所有元素才能找到 K 个，但每个元素只会被访问一次，所以也是 O(N)。综合时间复杂度为 O(N)。

空间复杂度：

HashMap：最坏情况下，所有元素都不同，存储 N 个键值对，O(N)。bucket 数组：存储 N 个列表，所有元素也都在列表中，O(N)。综合空间复杂度为 O(N)。

桶中元素唯一性： 再次强调，在填充桶时，必须遍历 HashMap 的键集 (map.keySet())，以确保每个桶中存储的都是唯一的数字。这是避免结果错误的关键。

适用场景： 桶排序方法在处理频率范围相对较小（与元素数量N大致相同）的问题时表现优秀。如果频率范围极大，桶数组会非常稀疏，可能造成空间浪费，但对于 LeetCode 的这类问题，通常频率范围在 [0, N] 之间，因此是高效的选择。

通过理解并正确应用哈希映射和桶排序的原理，特别是对填充桶这一关键步骤的细致处理，我们可以高效且准确地解决“K个高频元素”这类问题。

以上就是LeetCode K个高频元素：桶排序算法与关键细节解析的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/297817.html

java red 为什么排序算法键值对

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

win10开始菜单打不开怎么解决_win10开始菜单修复技巧

上一篇 2025年11月4日 23:40:48

谷歌浏览器怎么恢复上次关闭的标签页_Chrome恢复已关闭网页方法

下一篇 2025年11月4日 23:41:03

用户投稿

修复Django电商项目中AJAX过滤产品列表图片不显示问题

在Django电商项目中，当使用AJAX动态加载过滤后的产品列表时，常遇到图片无法正常显示的问题。这通常是由于前端模板中图片加载方式（如data-setbg属性结合JavaScript库）与AJAX动态内容更新机制不兼容所致。解决方案是直接在AJAX返回的HTML中使用标准的标签来渲染图片，确保浏览…

程序猿
2026年5月10日
0000
Matplotlib 地图中多类型图例的创建与优化

本教程旨在解决matplotlib地图可视化中，如何在一个图例中同时展示颜色块（如区域分类）和自定义标记（如特定兴趣点）的问题。文章详细介绍了当传统`patch`对象无法正确显示标记时，如何利用`matplotlib.lines.line2d`创建标记图例句柄，并将其与颜色块图例句柄合并，从而生成一…

程序猿
2026年5月10日 • 用户投稿
1000
用户投稿

RichHandler与Rich Progress集成：解决显示冲突的教程

在使用rich库的`richhandler`进行日志输出并同时使用`progress`组件时，可能会遇到显示错乱或溢出问题。这通常是由于为`richhandler`和`progress`分别创建了独立的`console`实例导致的。解决方案是确保日志处理器和进度条组件共享同一个`console`实例…

程序猿
2026年5月10日
0000
用户投稿

修复点击时按钮抖动：CSS垂直对齐实践

本文探讨了在Web开发中，交互式按钮（如播放/暂停按钮）在点击时发生意外垂直位移的问题。通过分析CSS样式变化对元素布局的影响，我们发现这是由于按钮不同状态下的边框样式和内边距改变，以及默认的垂直对齐行为共同作用所致。核心解决方案是利用CSS的vertical-align属性，将其设置为middle…

程序猿
2026年5月10日
1000
用户投稿

理解编程指令：当结果正确，但实现方式不符要求时

本文探讨了在编程实践中，即使程序输出了正确的结果，但若其实现方式未能严格遵循既定指令，仍可能被视为“不正确”的问题。我们将通过具体示例，对比直接求和与累加求和两种实现策略，强调理解和遵守编程规范的重要性，以确保代码的健壮性、可维护性及符合项目要求。在软件开发过程中，我们经常会遇到这样的情况：编写的…

程序猿
2026年5月10日
0000
用户投稿

使用 Jupyter Notebook 进行探索性数据分析

Jupyter Notebook通过单元格实现代码与Markdown结合，支持数据导入（pandas）、清洗（fillna）、探索（matplotlib/seaborn可视化）、统计分析（describe/corr）和特征工程，便于记录与分享分析过程。 Jupyter Notebook 是进行探索性…

程序猿
2026年5月10日
0000
用户投稿

如何在HTML中插入表单元素_HTML表单控件与输入类型使用指南

HTML表单通过标签构建，包含action和method属性定义数据提交目标与方式，常用input类型如text、password、email等适配不同输入需求，配合label、required、placeholder提升可用性，结合textarea、select、button等控件实现完整交互，是…

程序猿
2026年5月10日
1000
用户投稿

前端缓存策略与JavaScript存储管理

根据数据特性选择合适的存储方式并制定清晰的读写与清理逻辑，能显著提升前端性能；合理运用Cookie、localStorage、sessionStorage、IndexedDB及Cache API，结合缓存策略与定期清理机制，可在保证用户体验的同时避免安全与性能隐患。前端缓存和JavaScript存…

程序猿
2026年5月10日
2000
用户投稿

HTML5网页如何实现手势操作 HTML5网页移动端交互的处理技巧

首先利用原生touch事件实现滑动判断，再通过preventDefault解决滚动冲突，接着引入Hammer.js处理复杂手势，最后通过优化点击区域、避免事件冲突和增加视觉反馈提升体验。在移动端浏览器中，HTML5网页可以通过触摸事件实现手势操作，提升用户体验。虽然原生JavaScript提供了基…

程序猿
2026年5月10日
0000
用户投稿

使用 WebCodecs VideoDecoder 实现精确逐帧回退

本文档旨在解决在使用 WebCodecs VideoDecoder 进行视频解码时，实现精确逐帧回退的问题。通过比较帧的时间戳与目标帧的时间戳，可以避免渲染中间帧，从而提高用户体验。本文将提供详细的解决方案和示例代码，帮助开发者实现精确的视频帧控制。在使用 WebCodecs VideoDecod…

程序猿
2026年5月10日
0000
用户投稿

Discord.py 交互按钮超时与持久化解决方案

本教程旨在解决Discord.py中交互按钮在一段时间后出现“This Interaction Failed”错误的问题。我们将深入探讨视图（View）的超时机制，并提供通过正确设置timeout参数以及利用bot.add_view()方法实现按钮持久化的具体方案，确保您的机器人交互功能稳定可靠，即…

程序猿
2026年5月10日
0000
用户投稿

JavaScript 闭包：理解闭包原理与内存泄漏问题

闭包是函数访问其外部作用域变量的能力，即使外部函数已执行完毕。如 inner 函数引用 outer 中的 count，形成闭包，使变量持久存在。闭包本身无害，但可能因延长变量生命周期导致内存泄漏，例如事件监听器引用大对象时。若未及时清理 DOM 事件或定时器，闭包会阻止垃圾回收，造成内存占用过高。解…

程序猿
2026年5月10日
1000
用户投稿

JavaScript 动态菜单点击高亮效果实现教程

本教程详细介绍了如何使用 JavaScript 实现动态菜单的点击高亮功能。通过事件委托和状态管理，当用户点击菜单项时，被点击项会高亮显示（绿色），同时其他菜单项恢复默认样式（白色）。这种方法避免了不必要的DOM操作，提高了性能和代码可维护性，确保了无论点击方向如何，功能都能稳定运行。动态菜单高亮…

程序猿
2026年5月10日
2000
用户投稿

html5怎么画实线_HTML5用CSS border-style:solid画元素实线边框【绘制】

可通过CSS的border-style属性设为solid添加实线边框：一、内联样式用border:2px solid #000；二、内部样式表统一设置如div{border:1px solid #333}；三、外部CSS文件定义.my-box{border:3px solid red}并引入；四、单…

程序猿
2026年5月10日
2000
用户投稿

JavaScript函数中插入加载动画（Spinner）的正确方法

本文旨在解决在JavaScript函数中插入加载动画（Spinner）时遇到的异步问题。通过引入async/await和Promise.all，确保在数据处理完成前后正确显示和隐藏加载动画，提升用户体验。我们将提供两种实现方案，并详细解释其原理和优势。在Web开发中，当执行耗时操作时，显示加载动画…

程序猿
2026年5月10日
1000
用户投稿

JS如何实现迭代器？迭代器协议

JavaScript中实现迭代器需遵循可迭代协议和迭代器协议，通过定义[Symbol.iterator]方法返回具备next()方法的迭代器对象，从而支持for…of和展开运算符；该机制统一了数据结构的遍历接口，实现惰性求值，适用于自定义对象、树、图及无限序列等复杂场景，提升代码通用性与…

程序猿
2026年5月10日
1000
用户投稿

使用 Pydantic v2 实现条件性必填字段

本文介绍了如何在 Pydantic v2 模型中实现条件性必填字段。通过自定义验证器，可以根据模型中其他字段的值来动态地控制某些字段是否为必填项，从而满足 API 交互中数据验证的复杂需求。本文提供了一个具体的示例，展示了如何确保模型中至少有一个字段被赋值。在 Pydantic v2 中，虽然没有…

程序猿
2026年5月10日
0000
用户投稿

动态更新圆形进度条：JavaScript成绩计算器集成指南

本文档旨在指导开发者如何将JavaScript成绩计算系统与动态圆形进度条集成，实现可视化展示平均成绩。我们将详细讲解如何修改现有的JavaScript代码，使其在计算出平均分后，能够动态更新圆形进度条的进度，从而提供更直观的用户体验。本文档包含详细的代码示例和注意事项，帮助开发者轻松实现这一功能。…

程序猿
2026年5月10日
0000
用户投稿

React组件中动态属性值的管理与同步：利用状态实现受控组件

本教程旨在解决react组件中动态属性值同步使用的问题。我们将探讨如何利用react的`usestate` hook来管理组件内部状态，从而实现一个属性的值动态地影响另一个属性，并构建出可预测、易于维护的受控组件。文章将通过具体代码示例，详细阐述从初始化状态到处理状态更新的完整过程，并强调受控组件在…

程序猿
2026年5月10日
0000
用户投稿

如何讲html和css_讲解HTML与CSS结合使用基础【基础】

需将HTML与CSS结合使用以实现网页结构与样式的分离：HTML定义标题、段落等语义结构，CSS控制颜色、字体等外观；可通过内联样式、内部样式表或外部CSS文件引入样式，并利用类选择器和ID选择器精准应用。如果您希望网页不仅展示内容，还能具备基本的样式和结构布局，则需要将HTML与CSS结合使用。…

程序猿
2026年5月10日
1000