Redisbook学习笔记(1)字典(3)

渐进式rehash在上一节,我们了解了字典的rehash过程,需要特别指出的是,rehash程序并不是在激活之后就马上执行直到完成的,而是分多次、渐进式地完成的。假设这

渐进式rehash

在上一节,我们了解了字典的rehash 过程,需要特别指出的是,rehash 程序并不是在激活之

后就马上执行直到完成的,而是分多次、渐进式地完成的。

假设这样一个场景:在一个有很多键值对的字典里,某个用户在添加新键值对时触发了rehash

过程,如果这个rehash 过程必须将所有键值对迁移完毕之后才将结果返回给用户,这样的处理

方式将是非常不友好的。

另一方面,要求服务器必须阻塞直到rehash 完成,这对于Redis 服务器本身也是不能接受的。

为了解决这个问题,Redis 使用了渐进式(incremental)的rehash 方式:通过将rehash 分散

到多个步骤中进行,从而避免了集中式的计算。

Get笔记 Get笔记

Get笔记,一款AI驱动的知识管理产品

Get笔记 125 查看详情 Get笔记

渐进式rehash 主要由_dictRehashStep 和dictRehashMilliseconds 两个函数进行:
. _dictRehashStep 用于对数据库字典、以及哈希键的字典进行被动rehash ;
. dictRehashMilliseconds 则由Redis 服务器常规任务程序(server cron job)执行,用
于对数据库字典进行主动rehash ;
_dictRehashStep
每次执行_dictRehashStep ,ht[0]->table 哈希表第一个不为空的索引上的所有节点就会全
部迁移到ht[1]->table 。

在rehash 开始进行之后(d->rehashidx 不为-1),每次执行一次添加、查找、删除操作,
_dictRehashStep 都会被执行一次:

wKiom1Lfx8-xIvSUAAFG-ophSV4572.jpg

因为字典会保持哈希表大小和节点数的比率在一个很小的范围内,所以每个索引上的节点数量
不会很多(从目前版本的rehash 条件来看,平均只有一个,最多通常也不会超过五个),所以
在执行操作的同时,对单个索引上的节点进行迁移,几乎不会对响应时间造成影响。
dictRehashMilliseconds
dictRehashMilliseconds 可以在指定的毫秒数内,对字典进行rehash 。
当Redis 的服务器常规任务执行时,dictRehashMilliseconds 会被执行,在规定的时间内,
尽可能地对数据库字典中那些需要rehash 的字典进行rehash ,从而加速数据库字典的rehash
进程(progress)。
其他措施
在哈希表进行rehash 时,字典还会采取一些特别的措施,确保rehash 顺利、正确地进行:
 因为在rehash 时,字典会同时使用两个哈希表,所以在这期间的所有查找、删除等操作,
除了在ht[0] 上进行,还需要在ht[1] 上进行。
 在执行添加操作时,新的节点会直接添加到ht[1] 而不是ht[0] ,,这样保证ht[0] 的节
点数量在整个rehash 过程中都只减不增。

字典的收缩
上面关于rehash 的章节描述了通过rehash 对字典进行扩展(expand)的情况,如果哈希表的
可用节点数比已用节点数大很多的话,那么也可以通过对哈希表进行rehash 来收缩(shrink)
字典。
收缩rehash 和上面展示的扩展rehash 的操作几乎一样,它执行以下步骤:
1. 创建一个比ht[0]->table 小的ht[1]->table ;
2. 将ht[0]->table 中的所有键值对迁移到ht[1]->table ;
3. 将原有ht[0] 的数据清空,并将ht[1] 替换为新的ht[0] ;
扩展rehash 和收缩rehash 执行完全相同的过程,一个rehash 是扩展还是收缩字典,关键在于
新分配的ht[1]->table 的大小:
. 如果rehash 是扩展操作,那么ht[1]->table 比ht[0]->table 要大;
. 如果rehash 是收缩操作,那么ht[1]->table 比ht[0]->table 要小;
字典的收缩规则由redis.c/htNeedsResize 函数定义:

/** 检查字典的使用率是否低于系统允许的最小比率**是的话返回1 ,否则返回0 。*/int htNeedsResize(dict *dict) {long long size, used;// 哈希表已用节点数量size = dictSlots(dict);// 哈希表大小used = dictSize(dict);// 当哈希表的大小大于DICT_HT_INITIAL_SIZE// 并且字典的填充率低于REDIS_HT_MINFILL 时// 返回1return (size && used && size > DICT_HT_INITIAL_SIZE &&(used*100/size 在默认情况下,REDIS_HT_MINFILL 的值为10 ,也即是说,当字典的填充率低于10% 时,程
序就可以对这个字典进行收缩操作了。
字典收缩和字典扩展的一个区别是:
. 字典的扩展操作是自动触发的(不管是自动扩展还是强制扩展);
. 而字典的收缩操作则是由程序手动执行。
因此,使用字典的程序可以决定何时对字典进行收缩:
. 当字典用于实现哈希键的时候,每次从字典中删除一个键值对,程序就会执行一次
htNeedsResize 函数,如果字典达到了收缩的标准,程序将立即对字典进行收缩;
. 当字典用于实现数据库键空间(key space) 的时候, 收缩的时机由
redis.c/tryResizeHashTables 函数决定.

字典其他操作
除了添加操作和伸展/收缩操作之外,字典还定义了其他一些操作,比如常见的查找、删除和更
新。
因为链地址法哈希表实现的相关信息可以从任何一本数据结构或算法书上找到,这里不再对字
典的其他操作进行介绍,不过前面对创建字典、添加键值对、收缩和扩展rehash 的讨论已经涵
盖了字典模块的核心内容。

字典的迭代
字典带有自己的迭代器实现——对字典进行迭代实际上就是对字典所使用的哈希表进行迭代:
. 迭代器首先迭代字典的第一个哈希表,然后,如果rehash 正在进行的话,就继续对第二
个哈希表进行迭代。
. 当迭代哈希表时,找到第一个不为空的索引,然后迭代这个索引上的所有节点。
. 当这个索引迭代完了,继续查找下一个不为空的索引,如此循环,一直到整个哈希表都迭
代完为止。
整个迭代过程可以用伪代码表示如下:

def iter_dict(dict):// 迭代0 号哈希表iter_table(ht[0]->table)// 如果正在执行rehash ,那么也迭代1 号哈希表if dict.is_rehashing(): iter_table(ht[1]->table)def iter_table(table):// 遍历哈希表上的所有索引for index in table:// 跳过空索引if table[index].empty():continue// 遍历索引上的所有节点for node in table[index]:// 处理节点do_something_with(node)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/539158.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 14:22:42
下一篇 2025年11月9日 14:28:00

相关推荐

  • Redis3.2开启远程访问详细步骤

    redis是一个开源的使用ansi c语言编写、支持网络、可基于内存亦可持久化的日志型、key-value数据库,并提供多种语言的api。redis支持远程访问,详细步骤小编已为大家整理出来了,具体步骤如下: redis默认只允许本地访问,要使redis可以远程访问可以修改redis.conf打开r…

    好文分享 2025年12月24日
    000
  • Redis配置文件redis.conf详细配置说明

    本文列出了redis的配置文件redis.conf的各配置项的详细说明,简单易懂,有需要的盆友可以参考哦。 redis.conf 配置项说明如下 redis配置文件详解 # vi redis.confdaemonize yes #是否以后台进程运行pidfile /var/run/redis/red…

    好文分享 2025年12月24日
    000
  • Flask应用中动态图片更新与上传教程

    本教程详细介绍了如何在flask web应用中展示静态图片,并通过%ignore_a_1%实现图片的定时刷新,解决浏览器缓存问题。同时,文章还涵盖了如何在flask后端处理图片上传,并将其与前端展示及刷新机制相结合,提供了一个完整的图片管理与动态显示解决方案。 1. Flask应用中静态图片的基本展…

    2025年12月23日 好文分享
    000
  • PHP 多语言网站切换:会话管理与翻译函数实践

    本教程详细介绍了使用 php 构建多语言网站的实现方法。文章涵盖了如何通过 url 参数和会话管理实现语言切换,以及如何设计一套健壮的翻译加载与显示机制,以避免常见的变量未定义和字符串偏移错误。通过封装的辅助函数,确保翻译内容正确加载和渲染,提升代码的可维护性和用户体验。 构建多语言网站的核心挑战 …

    2025年12月23日
    300
  • 将独立Python逻辑集成到Django Web应用:以计时器项目为例

    本教程旨在指导初学者如何将一个独立的Python命令行计时器应用改造并集成到Django Web项目中。文章将详细介绍如何通过Django的视图、表单和模板机制处理用户输入、执行核心Python逻辑,并最终在HTML页面上展示结果,同时探讨将命令行应用特性迁移到Web环境的关键考量。 理解从命令行到…

    2025年12月23日
    000
  • 如何将Python后端逻辑与Django和HTML进行集成

    本教程旨在指导初学者如何将独立的Python命令行应用程序转换为基于Django的Web应用。文章将详细阐述如何通过Django的视图、URL配置和表单系统,将Python逻辑与HTML前端进行交互,实现用户输入捕获和结果展示。重点在于重构Python代码以适应Web环境,并利用Django For…

    2025年12月23日
    000
  • 将Python命令行应用集成到Django Web项目:以计时器为例

    本文将指导您如何将一个独立的python命令行计时器应用程序改造并集成到django web项目中。我们将详细介绍如何利用django的视图、模板和表单系统来捕获用户输入,并将原有的python逻辑适配到web环境,同时探讨在web应用中处理后台任务和用户通知的策略,帮助初学者顺利过渡。 从命令行到…

    好文分享 2025年12月23日
    000
  • 部署与调度Node.js爬虫:从本地执行到云端集成

    本教程详细指导如何部署和调度一个基于node.js的网页爬虫,使其能够每日自动运行并将其数据提供给前端应用。文章将区分客户端与服务器端javascript的运行环境,介绍本地任务调度方法,并探讨将爬虫集成到在线服务以实现数据共享的策略,同时涵盖数据持久化、cors处理及部署最佳实践。 1. 理解No…

    2025年12月23日
    000
  • HTML5WebSocket怎么通信_HTML5WebSocket实现实时通信的原理与代码

    WebSocket基于TCP实现全双工通信,通过HTTP握手升级协议后进行持久化双向数据传输,适用于聊天、通知等高频交互场景;前端使用JavaScript的WebSocket API建立连接并监听事件,后端可用Node.js的ws库创建服务器;需注意代理配置、自动重连、JSON格式消息及安全认证等问…

    2025年12月23日
    000
  • 实现实时UI更新:利用SSE与WebSocket告别传统轮询

    本文探讨了如何在不依赖传统http轮询的情况下,实现用户界面(ui)的实时动态更新,尤其适用于聊天应用中的用户活动状态显示。文章详细介绍了两种主流技术:服务器发送事件(sse)和websocket,并阐明了它们的工作原理、适用场景及选择依据。通过采用这些技术,服务器能够主动向客户端推送数据,从而避免…

    好文分享 2025年12月23日
    000
  • HTML5在线如何实现实时视频聊天 HTML5在线通信功能的开发方法

    实现实时视频聊天主要依赖WebRTC技术,1. 通过getUserMedia获取音视频流,RTCPeerConnection建立P2P连接,RTCDataChannel传输数据;2. 使用Node.js+Socket.IO搭建信令服务器交换SDP与ICE信息;3. 借助STUN/TURN服务器穿透N…

    2025年12月23日
    000
  • Web内容访问控制:用户认证、会话管理与数字版权保护(DRM)

    本文旨在提供一个全面的指南,介绍如何在web应用中实现基于用户登录状态的内容访问控制。我们将详细探讨利用会话和cookie进行用户认证的机制,包括登录流程、会话管理及安全性考量。此外,文章还将深入讨论数字版权管理(drm)技术,如widevine、playready和fairplay,以应对视频内容…

    2025年12月23日
    000
  • 如何实现HTML在线实时聊天_HTML在线实时聊天功能实现与消息推送方案

    核心是WebSocket实现双向通信,替代传统HTTP轮询;前端用JavaScript创建连接并监听消息,后端如Node.js或Spring Boot提供支持;备选方案包括SSE和长轮询;配合心跳、重连、消息队列等机制保障稳定性。 要在HTML网页上实现在线实时聊天,核心是解决消息的即时推送问题。传…

    2025年12月23日
    000
  • Discord用户头像链接的动态获取与持久性挑战

    本文探讨了discord用户头像链接的持久性问题。由于discord为上传图片生成随机url,直接获取一个“始终更新且链接不变”的用户头像链接是不可行的。唯一可靠的方法是通过discord api动态获取用户的最新头像url,并利用其用户id作为稳定标识符。 Discord用户头像URL的本质与限制…

    2025年12月23日
    000
  • HTML表单重复提交漏洞怎么避免_表单重复提交导致数据异常漏洞避免方法

    答案:避免HTML表单重复提交需前端禁用按钮、后端令牌验证与幂等设计、数据库唯一约束协同防御。 HTML表单重复提交,这事儿说起来挺头疼的,因为它不仅影响用户体验,更可能直接导致数据异常,比如订单重复创建、支付重复扣款,甚至一些敏感操作被多次执行。在我看来,避免这类漏洞,本质上是一场客户端与服务器端…

    2025年12月23日
    000
  • HTML数据如何实现实时采集 HTML数据流式处理的架构设计

    答案:构建低延迟、高吞吐的实时HTML流处理系统需分四步:1. 采集层用轻量HTTP或无头浏览器动态抓取,结合增量识别与分布式集群提升效率;2. 解析层采用流式解析器与规则抽取,提取结构化数据并容错降级;3. 流架构通过消息队列解耦,接入Flink等引擎做实时计算与多端输出;4. 保障层实现重试、限…

    2025年12月23日
    000
  • HTML数据如何实现分布式采集 HTML数据分布式爬虫的架构设计

    答案:构建分布式HTML采集系统需整合任务调度、去重、存储与监控模块,以Redis为核心协调任务分发与去重,通过消息队列实现负载均衡,结合布隆过滤器减少重复抓取,利用无状态工作节点支持弹性扩展,依托ZooKeeper保障高可用,并集成反爬适配与请求控制机制,确保系统稳定高效运行。 要实现HTML数据…

    好文分享 2025年12月23日
    000
  • HTML数据如何构建数据API HTML数据接口的开发与部署

    答案:将HTML转为API需先解析稳定结构化数据,再用Flask等框架提供JSON接口。1. 确认HTML有清晰标签与更新规律;2. 用Python爬取并解析页面,封装为REST API;3. 部署至云服务器或Serverless平台;4. 加缓存、设请求头、控频次以提升稳定性。 直接把HTML数据…

    2025年12月23日
    000
  • HTML数据如何实现批量下载 HTML数据批量采集的自动化方案

    实现HTML数据批量下载需构建自动化流程,核心是模拟访问、提取内容、结构化存储。1. Python+Requests+BeautifulSoup适合中小规模,通过requests获取页面,BeautifulSoup解析并保存为CSV/JSON。2. 动态页面用Selenium或Playwright,…

    2025年12月23日
    000
  • HTML数据如何实现数据服务 HTML数据服务化的架构模式

    HTML数据服务化是将网页中的结构化信息提取并转为API服务的过程。1. 通过爬虫技术解析DOM,利用CSS选择器或XPath定位目标数据,并进行清洗与格式标准化;2. 将清洗后数据封装为JSON等格式,设计RESTful接口支持分页与查询;3. 构建中间层服务,采用缓存、定时任务和微服务提升稳定性…

    2025年12月23日
    000

发表回复

登录后才能评论
关注微信