如何利用JavaScript的Map和Set实现数据去重和关联存储，以及它们与对象和数组的性能对比？

程序猿 • 2025年12月20日 14:18:55 • 用户投稿 • 阅读 0

答案是Map和Set在处理非字符串键、对象引用唯一性及大数据量去重时具有显著优势。它们支持任意类型键（Map）或元素（Set），基于引用比较实现高效去重（Set）和复杂关联存储（Map），内部采用哈希结构使查找、插入、删除操作平均时间复杂度为O(1)，远优于数组遍历的O(n)。尤其在大规模数据去重或需以对象为键的场景中，性能优势明显；而传统Object仅支持字符串/Symbol键且存在原型链干扰，Array去重效率低下。实际开发中，应根据唯一性需求、键类型、顺序要求、序列化需要及内存管理来选择：Set适用于唯一值集合去重，Map适合复杂键的快速关联查询，Object用于结构化数据与JSON序列化，Array则适用于有序列表和索引访问。

在我看来，JavaScript中的

Map

和

Set

为我们处理数据去重和复杂关联存储提供了远比传统对象（

Object

）和数组（

Array

）更强大、更灵活，并且在很多场景下性能更优的工具。它们的核心优势在于能够以任意类型的值作为键（

Map

）或元素（

Set

），并且内部实现通常优化了查找和插入的效率，尤其是在处理非字符串键或需要严格去重时，简直是开发利器。

解决方案

要利用

Map

和

Set

实现数据去重和关联存储，我们首先要理解它们各自的设计哲学和使用场景。

数据去重：

Set

的优雅之道

Set

是一个存储唯一值的集合。这意味着当你尝试向

Set

中添加一个已经存在的值时，它会被忽略，而不会抛出错误或改变集合。这让它成为去重操作的天然选择。

立即学习“Java免费学习笔记（深入）”；

对于基本数据类型（字符串、数字、布尔值、

undefined

、

null

），

Set

的去重是值比较。而对于对象，

Set

则是通过引用比较来判断唯一性。

// 示例1: 基本数据类型去重const numbers = [1, 2, 3, 2, 1, 4, 5, 4];const uniqueNumbers = [...new Set(numbers)]; // [1, 2, 3, 4, 5]console.log(uniqueNumbers);// 示例2: 对象去重（按引用）const obj1 = { id: 1, name: 'A' };const obj2 = { id: 2, name: 'B' };const obj3 = { id: 1, name: 'A' }; // 看起来和obj1一样，但引用不同const obj4 = obj1; // 与obj1引用相同const objectSet = new Set();objectSet.add(obj1);objectSet.add(obj2);objectSet.add(obj3); // 会被添加，因为引用不同objectSet.add(obj4); // 不会被添加，因为引用与obj1相同console.log([...objectSet]);// 结果会是 [ { id: 1, name: 'A' }, { id: 2, name: 'B' }, { id: 1, name: 'A' } ]// 因为obj1, obj2, obj3是三个不同的对象引用

如果你想对对象进行“内容去重”而不是“引用去重”，那通常需要一点额外的处理，比如将对象序列化为字符串后再放入

Set

，或者自己实现一个哈希函数，但这就不那么

Set

原生了，有时候会引入一些复杂性，比如序列化后的字符串可能无法反序列化回原始对象，或者失去类型信息。

关联存储：

Map

的强大之处

Map

是一个键值对的集合，与

Object

类似，但

Map

的键可以是任意数据类型（对象、函数、甚至另一个

Map

或

Set

），而

Object

的键最终会被强制转换为字符串或Symbol。此外，

Map

会保持键值对的插入顺序，这在某些场景下非常有用。

// 示例1: 使用对象作为键const user1 = { id: 1, name: 'Alice' };const user2 = { id: 2, name: 'Bob' };const user3 = { id: 3, name: 'Charlie' };const userRoles = new Map();userRoles.set(user1, 'Admin');userRoles.set(user2, 'Editor');userRoles.set(user3, 'Viewer');console.log(userRoles.get(user1)); // 'Admin'// 尝试用一个内容相同但引用不同的对象作为键const user1_copy = { id: 1, name: 'Alice' };console.log(userRoles.get(user1_copy)); // undefined，因为引用不同// 示例2: 存储DOM元素关联数据const myDiv = document.createElement('div');const myMap = new Map();myMap.set(myDiv, { dataId: 'widget-123', config: { theme: 'dark' } });// 之后可以轻松通过DOM元素获取其关联数据console.log(myMap.get(myDiv)); // { dataId: 'widget-123', config: { theme: 'dark' } }

Map

的这种特性，让它在需要将数据与非字符串标识符（比如DOM节点、类实例、甚至函数）关联起来时，显得异常强大和简洁。我个人在处理前端组件的内部状态管理，或者需要给某些原生DOM元素附加额外数据时，就特别喜欢用

Map

，它能避免污染DOM元素本身，也避免了全局变量的尴尬。

JavaScript中，Map和Set在处理非字符串键或复杂数据结构时，究竟有哪些独特优势？

说实话，当我第一次深入了解

Map

和

Set

的时候，我最大的感触就是它们终于解决了JavaScript中长期以来处理复杂键和唯一性问题的一些痛点。最显著的优势，无疑是它们对非字符串键和引用语义的支持。

首先，

Map

允许我们使用任何JavaScript值作为键。这与

Object

形成了鲜明对比，因为

Object

的键最终都会被强制转换为字符串（或者Symbol，但Symbol的使用场景相对有限）。试想一下，如果你想把一个DOM元素、一个对象实例或者一个函数作为键来存储一些数据，用

Object

几乎是不可能直接做到的，你不得不发明一些字符串ID或者序列化机制，这不仅麻烦，还容易出错，并且可能破坏原始对象的引用关系。

Map

则直接解决了这个问题，它通过内部的哈希表机制，能够直接将这些复杂的对象作为键进行存储和查找，并且是基于引用的比较。这意味着

{a:1}

和

{a:1}

作为两个不同的对象实例，在

Map

中可以作为两个独立的键存在，这在处理配置、缓存或者状态管理时，提供了前所未有的灵活性和精确性。

其次，

Set

和

Map

在判断元素或键的唯一性时，对于对象类型，采用的是引用相等性。这和我们日常编程中对“同一个对象”的理解是吻合的。比如，当你有一个对象数组，你想要找出其中所有不同的对象实例，

Set

能轻而易举地做到。而如果用传统数组去重，你可能需要遍历并进行深度比较，那复杂度可就上去了。当然，这也有两面性，如果你想要的是“内容相同”的对象去重，那么

Set

的引用比较就不够了，你可能需要自己动手，比如先将对象规范化或者序列化成字符串再放入

Set

。但这本身也说明了

Set

设计的初衷，就是为了处理这种“实例唯一性”的需求。

再者，

Map

和

Set

都保证了元素的插入顺序。这对于很多需要维持数据顺序的场景来说，是一个非常实用的特性。虽然ES2015之后，

Object

的属性遍历顺序也有了更明确的规范（非整数键按插入顺序），但

Map

和

Set

从设计之初就明确保证了这一点，并且在所有键类型上都保持一致，这使得它们在需要有序迭代时更加可靠。我个人在构建一些配置面板或者需要按照用户操作顺序展示数据的组件时，就经常依赖

Map

的这个特性。

总的来说，

Map

和

Set

的独特优势在于它们对JavaScript数据模型更深层次的理解和支持，它们能够以更自然、更高效的方式处理那些传统

Object

和

Array

力所不能及的场景，尤其是涉及到复杂数据类型作为标识符或者需要严格控制唯一性时。

Map和Set与传统对象和数组相比，在性能上体现出怎样的差异，尤其是在大数据量场景下？

说到性能，这玩意儿其实挺有意思的，很多时候我们写代码不会第一时间考虑极致性能，但一旦数据量上来，或者操作频率变高，这些细节就变得至关重要了。

Map

和

Set

在设计上，就是为了优化某些特定操作的性能，尤其是查找、插入和删除。

从理论上的时间复杂度（也就是我们常说的Big O表示法）来看：

Map

和

Set

的查找（

get

/

has

）、插入（

Set

/

add

）和删除（

delete

）操作，平均时间复杂度都是O(1)。这意味着无论你的

Map

或

Set

里有多少个元素，理论上这些操作所需的时间是恒定的。这得益于它们通常基于哈希表（或类似结构）的内部实现。

Object

的属性访问和修改，平均时间复杂度也是O(1)，前提是键是字符串或Symbol。

Array

的查找（如

indexOf

、

includes

）或删除（需要遍历查找再splice）操作，时间复杂度是O(n)。这意味着随着数组长度n的增加，操作所需的时间会线性增长。

在大数据量场景下，这种差异就非常明显了。

想象一下，你有一个包含成千上万个元素的数组，需要进行去重操作：

如果你用

Array

的

filter

结合

indexOf

或

includes

来去重，每次

indexOf

或

includes

都需要遍历部分甚至整个数组，总的复杂度会是O(n^2)，这在数据量大的时候简直是灾难。但如果你用

Set

，只需要遍历一次数组，将所有元素添加到

Set

中，每次

add

操作都是O(1)，总复杂度就是O(n)。这个性能提升是巨大的。

再比如，你需要根据一个对象实例来快速查找其关联的数据：

如果你用

Array

存储键值对，每次查找都得遍历数组，复杂度O(n)。如果你用

Object

，那你就不能直接用对象实例作键，你得想办法生成一个唯一的字符串ID，然后用这个ID去查找。这增加了额外的复杂性和潜在的冲突风险。但如果用

Map

，直接把对象实例作键，

get

操作就是O(1)。

具体来说，性能差异体现在：

去重效率：

Set

在去重方面几乎是无敌的。无论是基本类型还是对象引用，它都能以极高的效率完成。对于大数据集，

Set

的性能远超任何基于数组遍历的去重方法。键值对查找与管理：

Map

在处理复杂键（非字符串）时的查找效率是

Object

无法比拟的，因为

Object

根本不支持这种键。即使是字符串键，在某些JavaScript引擎的优化下，

Map

在大量增删改查操作时，也可能比

Object

表现出更好的稳定性或略微的性能优势，因为它没有

Object

原型链查找的开销，并且其内部结构更专注于键值对操作。内存占用： 虽然

Map

和

Set

通常比纯粹的数组或对象有稍微大一点的内存开销（因为需要维护哈希表结构），但在大多数实际应用中，这种开销是微不足道的，而且它们的性能优势往往能弥补这一点。而且，

WeakMap

和

WeakSet

甚至提供了弱引用机制，可以避免内存泄漏，这是

Object

无法提供的。

总结一下，在需要频繁进行查找、插入、删除，或者处理唯一性，特别是涉及到非字符串键或大数据量时，

Map

和

Set

的性能优势是压倒性的。它们是现代JavaScript中处理这些问题的首选工具。

在实际开发中，如何根据具体场景选择Map、Set、对象或数组来优化数据处理逻辑？

选择合适的数据结构，就像裁缝选布料，得看你最终想做什么样的衣服。在JavaScript里，

Map

、

Set

、

Object

和

Array

各有千秋，没有绝对的“最好”，只有“最适合”。我个人在做选择时，通常会从以下几个维度去考虑：

数据的唯一性需求？

需要严格的唯一值集合？ 并且只关心“有没有”某个值，不关心它的额外属性？那毫无疑问是

Set

。比如，一个用户访问过的页面ID列表，一个已处理过的任务ID集合，或者一个黑名单中的IP地址。

new Set(arr)

这种简洁的去重方式，在很多场景下都非常高效。不需要唯一性，或者唯一性通过其他方式保证？ 那

Array

或

Object

可能更合适。

键的类型和查找方式？

键是任意类型（对象、DOM元素、函数等）？ 并且需要通过这个键来快速查找对应的值？那必须是

Map

。这是

Map

最核心的优势。例如，给每个DOM节点存储其对应的组件实例，或者根据一个复杂的配置对象来查找缓存结果。键总是字符串或Symbol？ 并且你希望通过点语法（

obj.key

）或者方括号语法（

obj['key']

）来访问？那

Object

通常是更直观和简洁的选择。它更适合表示结构化的数据记录，比如用户资料

{name: 'Alice', age: 30}

。只需要通过索引来访问元素？ 那

Array

是你的朋友。比如一个用户列表，你可能需要根据用户在列表中的位置来获取信息。

数据是否需要保持插入顺序？

键值对的插入顺序很重要？ 比如你需要按照添加的先后顺序遍历配置项，那

Map

是可靠的选择。元素的插入顺序很重要？ 比如一个日志列表，或者一个任务队列，那

Array

是首选。顺序不重要？

Object

（在某些旧环境或特定操作下）或者

Set

（虽然它也保持顺序，但如果你的核心需求不是唯一性，可能不是最佳选择）都可以。

数据是否需要被JSON序列化？

需要方便地转换为JSON字符串进行传输或存储？ 那

Object

和

Array

是天生就支持的。

Map

和

Set

不能直接被

JSON.stringify

序列化，你需要手动转换（比如

JSON.stringify(Array.from(myMap))

）。不需要序列化，或者只在内存中操作？

Map

和

Set

就没这个问题。

内存管理和生命周期？

键是对象，并且希望当键对象不再被引用时，其在集合中的条目也能被垃圾回收？ 那

WeakMap

和

WeakSet

是专门为此设计的。这对于避免内存泄漏，尤其是在处理DOM元素或大型对象缓存时非常有用。普通的

Map

和

Set

会对键保持强引用，阻止垃圾回收。

一些具体的应用场景示例：

缓存系统： 如果缓存键是复杂的对象（比如一个查询参数对象），我会用

Map

。如果缓存键是简单的字符串，

Object

可能就够了。事件监听器管理： 给DOM元素绑定事件时，我可能会用

Map

来存储每个DOM元素对应的监听函数，这样在移除元素时也能方便地移除监听器。用户权限管理：

Set

可以存储用户拥有的所有权限字符串，快速判断

permissions.has('admin')

。表单验证：

Set

可以存储所有不合法的输入字段，以便快速检查表单是否有效。组件状态： 如果组件的某个状态是一个需要保持顺序的键值对集合，并且键是对象，那

Map

很合适。如果只是简单的字符串键值对，

Object

更常见。数据列表展示： 多数情况下，

Array

是显示列表数据的首选，因为它支持索引和丰富的数组方法。

总之，没有银弹。深入理解每种数据结构的特点和内部机制，结合你的具体业务需求和数据特性，才能做出最明智的选择。有时候，甚至需要将它们组合起来使用，比如一个

Map

的键是对象，值是

Set

，来实现更复杂的数据管理逻辑。

以上就是如何利用JavaScript的Map和Set实现数据去重和关联存储，以及它们与对象和数组的性能对比？的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1521592.html

ai java javascript js json 内存占用前端大数据工具用户权限管理键值对

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

PHP 中不使用 Query 参数进行重定向并传递数据的方法

上一篇 2025年12月20日 14:18:44

什么是JavaScript的模块联邦中的共享依赖管理，以及它如何避免重复加载并保证版本一致性？

下一篇 2025年12月20日 14:19:03

用户投稿

composer require-dev和require有什么不同_Composer Require与Require-Dev区别解析

require用于声明项目运行必需的依赖，如框架、数据库组件和第三方SDK，这些包会随项目部署到生产环境；2. require-dev用于声明仅在开发和测试阶段需要的工具，如PHPUnit、PHPStan、Faker等，不会默认部署到生产环境；3. 安装时composer install根据环境决定…

程序猿
2026年5月10日
10000
用户投稿

修复Django电商项目中AJAX过滤产品列表图片不显示问题

在Django电商项目中，当使用AJAX动态加载过滤后的产品列表时，常遇到图片无法正常显示的问题。这通常是由于前端模板中图片加载方式（如data-setbg属性结合JavaScript库）与AJAX动态内容更新机制不兼容所致。解决方案是直接在AJAX返回的HTML中使用标准的标签来渲染图片，确保浏览…

程序猿
2026年5月10日
7000
用户投稿

开源免费PHP工具 PHP开发效率提升利器

推荐开源免费PHP开发工具以提升效率：VS Code、Sublime Text轻量高效，PhpStorm专业强大；调试用Xdebug、Kint、Ray；依赖管理选Composer；代码质量工具包括PHPStan、Psalm、PHP_CodeSniffer；数据库管理可用%ignore_a_1%MyA…

程序猿
2026年5月10日
0000
用户投稿

Golang JSON序列化：控制敏感字段暴露的最佳实践

本教程探讨golang中如何高效控制结构体字段在json序列化时的可见性。当需要将包含敏感信息的结构体数组转换为json响应时，通过利用`encoding/json`包提供的结构体标签，特别是`json:”-“`，可以轻松实现对特定字段的忽略，从而避免敏感数据泄露，确保api…

程序猿
2026年5月10日
3000
用户投稿

利用海象运算符简化条件赋值：Python教程与最佳实践

本文旨在探讨Python中海象运算符（:=）在条件赋值场景下的应用。通过对比传统if/else语句与海象运算符，以及条件表达式，分析海象运算符在简化代码、提高可读性方面的优势与局限性。并通过具体示例，展示如何在列表推导式等场景下合理使用海象运算符，同时强调其潜在的复杂性及替代方案，帮助开发者更好地掌…

程序猿
2026年5月10日
3000
用户投稿

Debian syslog性能优化技巧有哪些

提升Debian系统syslog (通常基于rsyslog)性能，关键在于精简配置和高效处理日志。以下策略能有效优化日志管理，提升系统整体性能：精简配置，高效加载: 在rsyslog配置文件中，仅加载必要的输入、输出和解析模块。使用全局指令设置日志级别和格式，避免不必要的处理。自定义模板: 创…

程序猿
2026年5月10日
0000
用户投稿

比特币新手教程比特币交易平台有哪些

比特币是一种去中心化的数字货币，基于区块链技术实现点对点交易，具有匿名性、有限发行和不可篡改等特点；新手可通过交易所购买，P2P交易获得比特币，常用平台包括Binance、OKX和Huobi；交易流程包括注册账户、实名认证、绑定支付方式、充值法币并下单购买，可选择市价单或限价单；比特币存储方式有交易…

程序猿
2026年5月10日
0000
用户投稿

c++中的SFINAE技术是什么_c++模板编程中的SFINAE原理与应用

SFINAE 是“替换失败不是错误”的原则，指模板实例化时若参数替换导致错误，只要存在其他合法候选，编译器不报错而是继续重载决议。它用于条件启用模板、类型检测等场景，如通过 decltype 或 enable_if 控制函数重载，实现类型特征判断。尽管 C++20 引入 Concepts 简化了部分…

程序猿
2026年5月10日
0000
用户投稿

Go语言mgo查询构建：深入理解bson.M与日期范围查询的正确实践

本文旨在解决go语言mgo库中构建复杂查询时，特别是涉及嵌套`bson.m`和日期范围筛选的常见错误。我们将深入剖析`bson.m`的类型特性，解释为何直接索引`interface{}`会导致“invalid operation”错误，并提供一种推荐的、结构清晰的代码重构方案，以确保查询条件能够正确…

程序猿
2026年5月10日
1000
用户投稿

修复点击时按钮抖动：CSS垂直对齐实践

本文探讨了在Web开发中，交互式按钮（如播放/暂停按钮）在点击时发生意外垂直位移的问题。通过分析CSS样式变化对元素布局的影响，我们发现这是由于按钮不同状态下的边框样式和内边距改变，以及默认的垂直对齐行为共同作用所致。核心解决方案是利用CSS的vertical-align属性，将其设置为middle…

程序猿
2026年5月10日
1000
用户投稿

Golang goroutine与channel调试技巧

使用go run -race检测数据竞争，结合runtime.NumGoroutine监控协程数量，通过pprof分析阻塞调用栈，利用select超时避免永久阻塞，有效排查goroutine泄漏、死锁和数据竞争问题。 Go语言的goroutine和channel是并发编程的核心，但它们也带来了调试上…

程序猿
2026年5月10日
0000
用户投稿

使用 Jupyter Notebook 进行探索性数据分析

Jupyter Notebook通过单元格实现代码与Markdown结合，支持数据导入（pandas）、清洗（fillna）、探索（matplotlib/seaborn可视化）、统计分析（describe/corr）和特征工程，便于记录与分享分析过程。 Jupyter Notebook 是进行探索性…

程序猿
2026年5月10日
0000
《魔兽世界》将于6月11日开启国服回归技术测试

《%ign%ignore_a_1%re_a_1%》官方宣布，将于6月11日开启国服回归技术测试，时间为7天，并称可以在6月内正式开服，玩家们可以访问官网下载战网客户端并预下载“巫妖王之怒”客户端，技术测试详情见下图。 WordAi WordAI是一个AI驱动的内容重写平台 53 查看详情以上就是《…

程序猿
2026年5月10日 • 用户投稿
2000
用户投稿

如何在HTML中插入表单元素_HTML表单控件与输入类型使用指南

HTML表单通过标签构建，包含action和method属性定义数据提交目标与方式，常用input类型如text、password、email等适配不同输入需求，配合label、required、placeholder提升可用性，结合textarea、select、button等控件实现完整交互，是…

程序猿
2026年5月10日
3000
用户投稿

前端缓存策略与JavaScript存储管理

根据数据特性选择合适的存储方式并制定清晰的读写与清理逻辑，能显著提升前端性能；合理运用Cookie、localStorage、sessionStorage、IndexedDB及Cache API，结合缓存策略与定期清理机制，可在保证用户体验的同时避免安全与性能隐患。前端缓存和JavaScript存…

程序猿
2026年5月10日
2000
用户投稿

网站标题关键词更新后，搜索引擎为何仍显示旧标题？

网站标题更新后，搜索引擎为何显示旧标题？网站SEO优化中，站长常修改网站标题关键词，期望搜索结果显示自定义标题。然而，即使更新标签、meta keywords、meta description和结构化数据中的name属性后，搜索结果仍显示旧标题，这令人费解。本文将对此进行解释。问题：站长修改了网…

程序猿
2026年5月10日
3000
用户投稿

HTML5网页如何实现手势操作 HTML5网页移动端交互的处理技巧

首先利用原生touch事件实现滑动判断，再通过preventDefault解决滚动冲突，接着引入Hammer.js处理复杂手势，最后通过优化点击区域、避免事件冲突和增加视觉反馈提升体验。在移动端浏览器中，HTML5网页可以通过触摸事件实现手势操作，提升用户体验。虽然原生JavaScript提供了基…

程序猿
2026年5月10日
0000
用户投稿

深入理解 Express.js 中 next() 参数的作用与中间件机制

本文深入探讨 express.js 中间件函数中的 `next()` 参数。它负责将控制权传递给请求-响应周期中的下一个中间件或路由处理程序。文章将详细解释 `next()` 的工作原理、中间件的注册与执行顺序，以及不正确使用 `next()` 可能导致请求挂起的风险，并通过代码示例和实际应用场景，…

程序猿
2026年5月10日
0000
用户投稿

创建指定大小并填充特定数据的Golang文件教程

本文将介绍如何使用Golang创建一个指定大小的文件，并用特定数据填充它。我们将使用 `os` 包提供的函数来创建和截断文件，从而实现快速生成大文件的目的。示例代码展示了如何创建一个10MB的文件，并将其填充为全零数据。掌握这些方法，可以方便地在例如日志系统或磁盘队列等场景中，预先创建测试文件或初始…

程序猿
2026年5月10日
0000
用户投稿

Python命令怎样使用profile分析脚本性能 Python命令性能分析的基础教程

使用Python的cProfile模块分析脚本性能最直接的方式是通过命令行执行python -m cProfile your_script.py，它会输出每个函数的调用次数、总耗时、累积耗时等关键指标，帮助定位性能瓶颈；为进一步分析，可将结果保存为文件python -m cProfile -o ou…

程序猿
2026年5月10日
0000