HashMap 的底层实现原理是怎样的?(基于JDK 8)

答案:JDK 8中HashMap采用“数组+链表/红黑树”结构,通过扰动哈希值并按位与确定索引,冲突时链表存储,链表长度≥8且容量≥64时转为红黑树;扩容时容量翻倍并再哈希,多线程不安全,推荐使用ConcurrentHashMap。

hashmap 的底层实现原理是怎样的?(基于jdk 8)

HashMap在JDK 8中的底层实现,核心是“数组+链表/红黑树”的混合结构。它通过哈希函数将键映射到数组索引,处理哈希冲突时,先用链表串联,当链表长度达到一定阈值后,会自动转换为红黑树以优化查找性能。

深入探讨HashMap的底层,我们得从它的骨架——一个

Node[] table

说起。这本质上就是一个数组,每个数组元素,我们称之为“桶”(bucket),可以存放一个

Node

对象。这个

Node

,其实就是

Entry

的升级版,它存储着键值对(key-value pair)、哈希值以及指向下一个Node的引用(

next

),这正是链表结构的基础。

当你调用

put(key, value)

时,HashMap首先会计算

key

的哈希值。这个哈希值的计算并非简单地直接使用

key.hashCode()

,而是经过一番位运算的“扰动处理”,目的是让哈希值的高位也能参与到最终的索引计算中,从而减少哈希冲突。具体来说,它会把

key.hashCode()

key.hashCode() >>> 16

进行异或操作,这在一定程度上打散了哈希值,让它们分布得更均匀。

得到扰动后的哈希值后,HashMap会用这个哈希值与

table.length - 1

进行按位与操作,得到最终的数组索引。这相当于取模运算,但位运算效率更高。

如果计算出的索引位置是空的,那很简单,直接创建一个新的

Node

并放进去。但如果这个位置已经有Node了,也就是发生了哈希冲突,事情就变得有趣了。

在JDK 8之前,这里通常就是简单的链表追加。但在JDK 8中,为了应对极端情况下的链表过长(导致查找效率退化到O(n)),引入了红黑树。当某个桶位的链表长度达到

TREEIFY_THRESHOLD

(默认是8)时,并且

HashMap

的容量

table.length

也达到了

MIN_TREEIFY_CAPACITY

(默认是64),这个链表就会被“树化”成红黑树。红黑树的查找、插入、删除操作的平均时间复杂度都是O(log n),这大大提升了性能。如果

HashMap

容量不足64,即使链表长度达到8,也不会直接树化,而是会先进行扩容(resize),因为扩容可能让元素重新分布,从而缓解冲突。

get(key)

的逻辑也类似,先计算

key

的哈希值和索引,然后去对应的桶位查找。如果桶位是链表,就遍历链表,通过

equals()

方法找到匹配的键;如果是红黑树,就按照红黑树的查找逻辑来。

HashMap为什么选择“数组+链表/红黑树”的混合结构?

这其实是一个经典的性能与空间平衡问题。单纯的数组查找效率高(O(1)),但一旦哈希冲突,处理起来就麻烦;单纯的链表插入删除快,但查找效率低(O(n))。HashMap巧妙地结合了两者:数组提供快速的索引定位,链表/红黑树处理冲突。

早期版本用链表,简单直接,但在哈希函数设计不佳或数据分布极端时,链表可能变得非常长,导致性能急剧下降。这就像你把所有文件都扔进一个文件夹,找起来自然慢。JDK 8引入红黑树,正是为了解决这个痛点。当冲突严重到一定程度,自动升级为红黑树,将查找复杂度从O(n)优化到O(log n),这是个非常聪明的权衡。它不是一开始就用红黑树,因为红黑树的节点比链表节点占用更多内存,且维护成本更高。只有在必要时才进行“树化”,这体现了其设计上的精妙与实用主义。

HashMap的扩容机制是如何工作的?

HashMap的容量不是一成不变的。当

HashMap

中的元素数量(

size

)超过了容量(

capacity

)与负载因子(

loadFactor

)的乘积,也就是

threshold

时,

HashMap

就会进行扩容操作。默认的负载因子是0.75,这意味着当

HashMap

填满其75%的容量时,它就会扩容。

扩容通常会使底层数组的容量翻倍。例如,如果当前容量是16,扩容后就变成32。扩容不仅仅是简单地增加数组大小,更重要的是要进行“再哈希”(rehash)。这意味着所有旧数组中的元素都需要重新计算它们在新数组中的位置,因为数组长度变了,

hash & (newCapacity - 1)

的结果也会改变。

这个过程是比较耗时的,因为它涉及到遍历所有已存在的Node,并重新分配到新的数组中。如果链表被树化了,在扩容时,红黑树也会被拆分或重新构建。JDK 8在扩容时对链表元素的重新定位做了优化:对于旧桶中的每个节点,如果其哈希值与旧容量进行与操作的结果为0,它就留在原位;如果结果不为0,它就会被移动到

原索引 + 旧容量

的位置。这样,一个旧桶中的链表(或红黑树)会被拆分成两个新桶中的链表(或红黑树),避免了重新计算每个元素的完整哈希值和索引,提高了效率。

扩容是保证HashMap性能的关键。它确保了桶的平均长度不会过长,从而维持了O(1)(平均)的查找和插入性能。但频繁的扩容也会带来性能开销,所以初始容量的选择有时也需要考量。

HashMap在多线程环境下为什么不安全,以及有哪些替代方案?

HashMap在多线程环境下是不安全的,这是一个非常重要的点,也是新手常犯的错误。它的不安全体现在几个方面:

数据丢失或覆盖:

put

操作时,如果两个线程同时尝试在同一个桶位插入元素,可能会导致其中一个线程的更新被另一个线程覆盖,或者链表结构被破坏。死循环(JDK 7及之前): 在JDK 7及之前的版本中,扩容时,由于链表头插法和多线程并发操作,可能会形成环形链表,导致

get

操作时陷入死循环,CPU占用100%。JDK 8通过改用尾插法和更精细的扩容逻辑,虽然避免了死循环,但仍然无法保证数据一致性。脏读: 一个线程在读取

HashMap

时,另一个线程可能正在修改它,导致读取到不一致的数据状态。

简单来说,

HashMap

的内部状态在并发修改时无法得到正确维护,因为它没有进行任何同步控制。

那么,在多线程环境下,我们应该使用什么呢?

Collections.synchronizedMap(Map m)

这是最简单粗暴的方法,它会返回一个线程安全的

Map

视图。它通过对所有方法进行

synchronized

同步,确保了原子性。但缺点是,它是一个全局锁,所有操作都必须等待,并发性能非常差。在高并发场景下,这几乎不可用。

ConcurrentHashMap

这是Java并发包

java.util.concurrent

下提供的、专门为高并发场景设计的哈希表。它是

HashMap

的线程安全版本,但其实现远比

synchronizedMap

复杂和高效。

ConcurrentHashMap

在JDK 7中采用了

Segment

分段锁的机制,将整个

HashMap

分成多个小的

Segment

,每个

Segment

独立加锁,从而允许多个线程同时访问不同的

Segment

,大大提高了并发度。

而在JDK 8中,

ConcurrentHashMap

进一步优化,放弃了

Segment

,转而采用了“

CAS + synchronized

”的策略。它在

put

操作时,先通过

CAS

(Compare-And-Swap)尝试更新,如果失败(说明有并发),则使用

synchronized

锁住当前桶的头节点(或红黑树的根节点)。这样,锁的粒度更细,只锁定发生冲突的桶,而不是整个

Map

或一个大的

Segment

,从而实现了更高的并发性能。同时,它也引入了红黑树来处理链表过长的问题,与

HashMap

的设计思想保持一致。

所以,如果你的应用场景涉及多线程,并且需要一个高性能的哈希表,那么

ConcurrentHashMap

几乎是唯一的,也是最佳的选择。不要尝试手动给

HashMap

加锁,那往往会引入更复杂的问题,并且性能通常不如

ConcurrentHashMap

以上就是HashMap 的底层实现原理是怎样的?(基于JDK 8)的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/87535.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月17日 17:29:09
下一篇 2025年11月17日 18:36:21

相关推荐

  • 怎样用免费工具美化PPT_免费美化PPT的实用方法分享

    利用KIMI智能助手可免费将PPT美化为科技感风格,但需核对文字准确性;2. 天工AI擅长优化内容结构,提升逻辑性,适合高质量内容需求;3. SlidesAI支持语音输入与自动排版,操作便捷,利于紧急场景;4. Prezo提供多种模板,自动生成图文并茂幻灯片,适合学生与初创团队。 如果您有一份内容完…

    2025年12月6日 软件教程
    000
  • Pages怎么协作编辑同一文档 Pages多人实时协作的流程

    首先启用Pages共享功能,点击右上角共享按钮并选择“添加协作者”,设置为可编辑并生成链接;接着复制链接通过邮件或社交软件发送给成员,确保其使用Apple ID登录iCloud后即可加入编辑;也可直接在共享菜单中输入邮箱地址定向邀请,设定编辑权限后发送;最后在共享面板中管理协作者权限,查看实时在线状…

    2025年12月6日 软件教程
    100
  • REDMI K90系列正式发布,售价2599元起!

    10月23日,redmi k90系列正式亮相,推出redmi k90与redmi k90 pro max两款新机。其中,redmi k90搭载骁龙8至尊版处理器、7100mah大电池及100w有线快充等多项旗舰配置,起售价为2599元,官方称其为k系列迄今为止最完整的标准版本。 图源:REDMI红米…

    2025年12月6日 行业动态
    200
  • Linux中如何安装Nginx服务_Linux安装Nginx服务的完整指南

    首先更新系统软件包,然后通过对应包管理器安装Nginx,启动并启用服务,开放防火墙端口,最后验证欢迎页显示以确认安装成功。 在Linux系统中安装Nginx服务是搭建Web服务器的第一步。Nginx以高性能、低资源消耗和良好的并发处理能力著称,广泛用于静态内容服务、反向代理和负载均衡。以下是在主流L…

    2025年12月6日 运维
    000
  • Linux journalctl与systemctl status结合分析

    先看 systemctl status 确认服务状态,再用 journalctl 查看详细日志。例如 nginx 启动失败时,systemctl status 显示 Active: failed,journalctl -u nginx 发现端口 80 被占用,结合两者可快速定位问题根源。 在 Lin…

    2025年12月6日 运维
    100
  • 华为新机发布计划曝光:Pura 90系列或明年4月登场

    近日,有数码博主透露了华为2025年至2026年的新品规划,其中pura 90系列预计在2026年4月发布,有望成为华为新一代影像旗舰。根据路线图,华为将在2025年底至2026年陆续推出mate 80系列、折叠屏新机mate x7系列以及nova 15系列,而pura 90系列则将成为2026年上…

    2025年12月6日 行业动态
    100
  • Linux如何优化系统性能_Linux系统性能优化的实用方法

    优化Linux性能需先监控资源使用,通过top、vmstat等命令分析负载,再调整内核参数如TCP优化与内存交换,结合关闭无用服务、选用合适文件系统与I/O调度器,持续按需调优以提升系统效率。 Linux系统性能优化的核心在于合理配置资源、监控系统状态并及时调整瓶颈环节。通过一系列实用手段,可以显著…

    2025年12月6日 运维
    000
  • 曝小米17 Air正在筹备 超薄机身+2亿像素+eSIM技术?

    近日,手机行业再度掀起超薄机型热潮,三星与苹果已相继推出s25 edge与iphone air等轻薄旗舰,引发市场高度关注。在此趋势下,多家国产厂商被曝正积极布局相关技术,加速抢占这一细分赛道。据业内人士消息,小米的超薄旗舰机型小米17 air已进入筹备阶段。 小米17 Pro 爆料显示,小米正在评…

    2025年12月6日 行业动态
    000
  • 荣耀手表5Pro 10月23日正式开启首销国补优惠价1359.2元起售

    荣耀手表5pro自9月25日开启全渠道预售以来,市场热度持续攀升,上市初期便迎来抢购热潮,一度出现全线售罄、供不应求的局面。10月23日,荣耀手表5pro正式迎来首销,提供蓝牙版与esim版两种选择。其中,蓝牙版本的攀登者(橙色)、开拓者(黑色)和远航者(灰色)首销期间享受国补优惠价,到手价为135…

    2025年12月6日 行业动态
    000
  • Vue.js应用中配置环境变量:灵活管理后端通信地址

    在%ignore_a_1%应用中,灵活配置后端api地址等参数是开发与部署的关键。本文将详细介绍两种主要的环境变量配置方法:推荐使用的`.env`文件,以及通过`cross-env`库在命令行中设置环境变量。通过这些方法,开发者可以轻松实现开发、测试、生产等不同环境下配置的动态切换,提高应用的可维护…

    2025年12月6日 web前端
    000
  • VSCode选择范围提供者实现

    Selection Range Provider是VSCode中用于实现层级化代码选择的API,通过注册provideSelectionRanges方法,按光标位置从内到外逐层扩展选择范围,如从变量名扩展至函数体;需结合AST解析构建准确的SelectionRange链式结构以提升选择智能性。 在 …

    2025年12月6日 开发工具
    000
  • JavaScript动态生成日历式水平日期布局的优化实践

    本教程将指导如何使用javascript高效、正确地动态生成html表格中的日历式水平日期布局。重点解决直接操作`innerhtml`时遇到的标签闭合问题,通过数组构建html字符串来避免浏览器解析错误,并利用事件委托机制优化动态生成元素的事件处理,确保生成结构清晰、功能完善的日期展示。 在前端开发…

    2025年12月6日 web前端
    000
  • JavaScript响应式编程与Observable

    Observable是响应式编程中处理异步数据流的核心概念,它允许随时间推移发出多个值,支持订阅、操作符链式调用及统一错误处理,广泛应用于事件监听、状态管理和复杂异步逻辑,提升代码可维护性与可读性。 响应式编程是一种面向数据流和变化传播的编程范式。在前端开发中,尤其面对复杂的用户交互和异步操作时,J…

    2025年12月6日 web前端
    000
  • JavaScript生成器与迭代器协议实现

    生成器和迭代器基于统一协议实现惰性求值与数据遍历,通过next()方法返回{value, done}对象,生成器函数简化了迭代器创建过程,提升处理大数据序列的效率与代码可读性。 JavaScript中的生成器(Generator)和迭代器(Iterator)是处理数据序列的重要机制,尤其在处理惰性求…

    2025年12月6日 web前端
    000
  • 环境搭建docker环境下如何快速部署mysql集群

    使用Docker Compose部署MySQL主从集群,通过配置文件设置server-id和binlog,编写docker-compose.yml定义主从服务并组网,启动后创建复制用户并配置主从连接,最后验证数据同步是否正常。 在Docker环境下快速部署MySQL集群,关键在于合理使用Docker…

    2025年12月6日 数据库
    000
  • Xbox删忍龙美女角色 斯宾塞致敬板垣伴信被喷太虚伪

    近日,海外游戏推主@HaileyEira公开发表言论,批评Xbox负责人菲尔·斯宾塞不配向已故的《死或生》与《忍者龙剑传》系列之父板垣伴信致敬。她指出,Xbox并未真正尊重这位传奇制作人的创作遗产,反而在宣传相关作品时对内容进行了审查和删减。 所涉游戏为年初推出的《忍者龙剑传2:黑之章》,该作采用虚…

    2025年12月6日 游戏教程
    000
  • 如何在mysql中分析索引未命中问题

    答案是通过EXPLAIN分析执行计划,检查索引使用情况,优化WHERE条件写法,避免索引失效,结合慢查询日志定位问题SQL,并根据查询模式合理设计索引。 当 MySQL 查询性能下降,很可能是索引未命中导致的。要分析这类问题,核心是理解查询执行计划、检查索引设计是否合理,并结合实际数据访问模式进行优…

    2025年12月6日 数据库
    000
  • VSCode入门:基础配置与插件推荐

    刚用VSCode,别急着装一堆东西。先把基础设好,再按需求加插件,效率高还不卡。核心就三步:界面顺手、主题舒服、功能够用。 设置中文和常用界面 打开软件,左边活动栏有五个图标,点最下面那个“扩展”。搜索“Chinese”,装上官方出的“Chinese (Simplified) Language Pa…

    2025年12月6日 开发工具
    000
  • VSCode性能分析与瓶颈诊断技术

    首先通过资源监控定位异常进程,再利用开发者工具分析性能瓶颈,结合禁用扩展、优化语言服务器配置及项目设置,可有效解决VSCode卡顿问题。 VSCode作为主流的代码编辑器,虽然轻量高效,但在处理大型项目或配置复杂扩展时可能出现卡顿、响应延迟等问题。要解决这些性能问题,需要系统性地进行性能分析与瓶颈诊…

    2025年12月6日 开发工具
    000
  • php查询代码怎么写_php数据库查询语句编写技巧与实例

    在PHP中进行数据库查询,最常用的方式是使用MySQLi或PDO扩展连接MySQL数据库。下面介绍基本的查询代码写法、编写技巧以及实用示例,帮助你高效安全地操作数据库。 1. 使用MySQLi进行查询(面向对象方式) 这是较为推荐的方式,适合大多数中小型项目。 // 创建连接$host = ‘loc…

    2025年12月6日 后端开发
    000

发表回复

登录后才能评论
关注微信