关于B+tree (附python 模拟代码)

前几天我写了点btree的东西(http://thuhak.blog.51cto.com/2891595/1261783),今天继续这个思路,继续写b+tree。而且b+tree才是我的目的,更加深入理解文件和数

前几天我写了点btree的东西(),今天继续这个思路,继续写b+tree。

而且b+tree才是我的目的,更加深入理解文件和数据库索引的基本原理。

腾讯云AI代码助手 腾讯云AI代码助手

基于混元代码大模型的AI辅助编码工具

腾讯云AI代码助手 98 查看详情 腾讯云AI代码助手

立即学习“Python免费学习笔记(深入)”;

在之前,我一直只把b+tree当成是btree的一种变形,或者说是在某种情况下的一种优化,另外一些情况可能还是btree好些。但是做完之后才发现,b+tree在各种情况都可以完全取代btree,香港虚拟主机,并能够让索引性能得到比btree更好的优化。因为b+tree设计的核心要点,是为了弥补btree最大的缺陷。

立即学习“Python免费学习笔记(深入)”;

btree最大的缺陷是什么?

      首先,我们知道对于btree和b+tree这种多路搜索树来说,一个很重要的特点就是树的度数非常大。因为只有这样才能够降低树的深度,减少磁盘读取的次数。而树的度数越大,叶子节点在树中的比例就越大。假设度数为1000,那么叶子节点比他上一层内部节点的数量至少要多1000倍,在上一层就更加可以忽略不计了。可以说树种99.9%的节点都是叶子节点。 但是对于btree来说,所有节点都是一样的结构,都含有一定数量的数据和指向节点的指针。这两项数据占据btree节点的几乎全部的空间。一个节点内的数据的数量比硬盘指针的数量少一,可以说和指针的数量几乎相等。对于python这种动态类型语言感觉不出来,但是对于C这种固定类型语言来说,即使这个children list数组为空,这个数组的空间也都是预留出去的。导致的结果就是占绝大多数的叶子节点的children list指针数组所占的磁盘空间完全浪费。

一个数据的大小和硬盘指针的大小取决于key-value中key和value大小的比值。假如说这个比值是2:1。那么btree浪费了几乎1/3的空间。

       b+tree针对这个问题的,把叶子节点和内节点的数据结构分开设计,让叶子节点不存放指针。因此同样大小的叶子节点,b+tree所能包含数据数量要比btree大。按照上面的假设就是大1/2。数的深度很可能比btree矮,大范围搜索或遍历所需要的载入磁盘的次数也少。

立即学习“Python免费学习笔记(深入)”;

        另外,b+tree还有一个特点是所有数据都存放在叶子节点,这些叶子节点也可以组成一个链表,并把这个链表的表头拿出来,方便直访问数据。有些文章认为这对于范围搜索来说是个巨大的优化。但是就我的看法,这个特性最大的作用仅仅是让代码更容易一些,性能上,只会比树的遍历差,而不会比树的遍历好。因为不管是用指向叶子节点的指针搜,还是用树的遍历搜,所搜索的节点的数量都是几乎相同的。在相同大小的范围搜索的性能,只取决于访问顺序的连续性。从树根向下遍历,那么一次可以取得大量的子节点的范围,并针对这些节点做访问排序,得到更好的访问连续性。如果是沿着指向兄弟节点的指针搜索,一是兄弟节点也许是后插入的,存放并不一定和自己是连续的,二是只有每次从硬盘中将改节点载入到内存,才知道兄弟节点放在硬盘哪个位置,这又变成了对硬盘的一个随机的同步操作,性能的下降可想而知。

      说b+tree因为有指向兄弟节点的指针方便数据库扫库这种结论,是不正确的。

立即学习“Python免费学习笔记(深入)”;

还是上代码吧,依旧只是在内存对数据结构插入删除查找的模拟

#!/usr/bin/env pythonfrom random import randint,choicefrom bisect import bisect_right,bisect_leftfrom collections import dequeclass InitError(Exception):passclass ParaError(Exception):passclass KeyValue(object):__slots__=(‘key’,’value’)def __init__(self,key,value):self.key=keyself.value=valuedef __str__(self):return str((self.key,self.value))def __cmp__(self,key):if self.key>key:return 1elif self.key==key:return 0else:return -1class Bptree_InterNode(object):def __init__(self,M):if not isinstance(M,int):raise InitError,’M must be int’if M=self.M-1def isempty(self):return len(self.ilist)self.Ldef isempty(self):return len(self.vlist)M:raise InitError,’L must be less or equal then M’else:self.__M=Mself.__L=Lself.__root=Bptree_Leaf(L)self.__leaf=self.__root@propertydef M(self):return self.__M@propertydef L(self):return self.__Ldef insert(self,key_value):node=self.__rootdef split_node(n1):mid=self.M/2newnode=Bptree_InterNode(self.M)newnode.ilist=n1.ilist[mid:]newnode.clist=n1.clist[mid:]newnode.par=n1.parfor c in newnode.clist:c.par=newnodeif n1.par is None:newroot=Bptree_InterNode(self.M)newroot.ilist=[n1.ilist[mid-1]]newroot.clist=[n1,newnode]n1.par=newnode.par=newrootself.__root=newrootelse:i=n1.par.clist.index(n1)n1.par.ilist.insert(i,n1.ilist[mid-1])n1.par.clist.insert(i+1,newnode)n1.ilist=n1.ilist[:mid-1]n1.clist=n1.clist[:mid]return n1.pardef split_leaf(n2):mid=(self.L+1)/2newleaf=Bptree_Leaf(self.L)newleaf.vlist=n2.vlist[mid:]if n2.par==None:newroot=Bptree_InterNode(self.M)newroot.ilist=[n2.vlist[mid].key]newroot.clist=[n2,newleaf]n2.par=newleaf.par=newrootself.__root=newrootelse:i=n2.par.clist.index(n2)n2.par.ilist.insert(i,n2.vlist[mid].key)n2.par.clist.insert(i+1,newleaf)newleaf.par=n2.parn2.vlist=n2.vlist[:mid]n2.bro=newleafdef insert_node(n):if not n.isleaf():if n.isfull():insert_node(split_node(n))else:p=bisect_right(n.ilist,key_value)insert_node(n.clist[p])else:p=bisect_right(n.vlist,key_value)n.vlist.insert(p,key_value)if n.isfull():split_leaf(n)else:returninsert_node(node)def search(self,mi=None,ma=None):result=[]node=self.__rootleaf=self.__leafif mi is None and ma is None:raise ParaError,’you need setup searching range’elif mi is not None and ma is not None and mi>ma:raise ParaError,’upper bound must be greater or equal than lower bound’def search_key(n,k):if n.isleaf():p=bisect_left(n.vlist,k)return (p,n)else:p=bisect_right(n.ilist,k)return search_key(n.clist[p],k)if mi is None:while True:for kv in leaf.vlist:if kv

立即学习“Python免费学习笔记(深入)”;

实现过程和btree很像,不过有几点显著不同。

1.内节点不存储key-value,只存放key

2.沿着内节点搜索的时候,香港服务器租用,查到索引相等的数要向树的右边走。所以二分查找要选择bisect_right

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/522088.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 06:07:21
下一篇 2025年11月9日 06:10:25

相关推荐

  • 如何解决本地图片在使用 mask JS 库时出现的跨域错误?

    如何跨越localhost使用本地图片? 问题: 在本地使用mask js库时,引入本地图片会报跨域错误。 解决方案: 要解决此问题,需要使用本地服务器启动文件,以http或https协议访问图片,而不是使用file://协议。例如: python -m http.server 8000 然后,可以…

    2025年12月24日
    200
  • 使用 Mask 导入本地图片时,如何解决跨域问题?

    跨域疑难:如何解决 mask 引入本地图片产生的跨域问题? 在使用 mask 导入本地图片时,你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢?让我们深入了解一下: mask 框架假设你以 http(s) 协议加载你的 html 文件,而当使用 file:// 协议打开本地文件时,就会产生跨域…

    2025年12月24日
    200
  • 正则表达式在文本验证中的常见问题有哪些?

    正则表达式助力文本输入验证 在文本输入框的验证中,经常遇到需要限定输入内容的情况。例如,输入框只能输入整数,第一位可以为负号。对于不会使用正则表达式的人来说,这可能是个难题。下面我们将提供三种正则表达式,分别满足不同的验证要求。 1. 可选负号,任意数量数字 如果输入框中允许第一位为负号,后面可输入…

    2025年12月24日
    000
  • 为什么多年的经验让我选择全栈而不是平均栈

    在全栈和平均栈开发方面工作了 6 年多,我可以告诉您,虽然这两种方法都是流行且有效的方法,但它们满足不同的需求,并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序,但它们的实现方式却截然不同。如果您在两者之间难以选择,我希望我在两者之间的经验能给您一些有用的见解。 在这篇文章中,我…

    2025年12月24日
    000
  • 姜戈顺风

    本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置 创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

    2025年12月24日
    000
  • 花 $o 学习这些编程语言或免费

    → Python → JavaScript → Java → C# → 红宝石 → 斯威夫特 → 科特林 → C++ → PHP → 出发 → R → 打字稿 []https://x.com/e_opore/status/1811567830594388315?t=_j4nncuiy2wfbm7ic…

    2025年12月24日
    000
  • 实践CSS3选择器的代码演练

    CSS3选择器动手实践代码 CSS3选择器是Web开发中非常重要的一部分,它可以帮助我们更好地选择和控制HTML元素。在本文中,我们将使用具体的代码示例来学习和实践CSS3选择器的用法。 第一种选择器是元素选择器。它通过HTML元素的标签名进行选择。例如,我们可以使用以下代码选择所有的段落元素: p…

    2025年12月24日
    000
  • CSS中line-height详解(代码实例)

    元素的高度是由什么决定对于我们解决页面显示问题和布局页面都有很大的帮助。 常规的操作表现是为一个块级元素设置height属性,则其拥有了高度: .test { border: 1px solid #ccc; height: 100px; width: 100px; } 但是根据熟知,当我们不为元素设…

    2025年12月24日
    000
  • CSS怎么实现自适应正方形?有代码吗

    本篇文章给大家带来的内容是关于CSS怎么实现自适应正方形?有代码吗,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 CSS实现自适应正方形/*使用padding-bottom实现正方形*/ #test7{ width: 400px; background: gray; } .plac…

    好文分享 2025年12月24日
    000
  • 用CSS实现网站变黑白色

    这篇文章主要介绍了关于用css实现网站变黑白色,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 以下为全站CSS代码.  html { filter:progid:DXImageTransform.Microsoft.BasicImage(grayscale=1); } 使用方法:这段…

    好文分享 2025年12月24日
    000
  • css悬浮效果阴影实现代码

    本文主要和大家介绍了css实现悬浮效果的阴影的方法示例的相关资料,希望能帮助到大家。我们先来看一下效果图。 要实现的效果图: 实现的代码: -webkit-box-shadow:0px 3px 3px #c8c8c8 ;-moz-box-shadow:0px 3px 3px #c8c8c8 ;box…

    2025年12月24日
    000
  • CSS实现宽高等比布局的代码

    宽度是高度的两倍(等比缩放)实现思路: 以父级元素为基准, 子级 width:100%; (也就是父级宽度的100%), padding-top:50% (也就是父级宽度的50%,根据css规范, padding用百分比表示的话, padding: 100%等于父元素的宽度); 为什么不直接`wid…

    2025年12月24日
    000
  • CSS记录用户密码实现代码分享

    本文主要和大家介绍了css 记录用户密码的方法的相关资料,简单的css代码,甚至不符合图灵完备的语言,但是也能成为一些攻击者的工具,下面简单介绍一下如何使用css去记录用户的密码。但是这些css脚本会出现在第三方css库中,所以使用第三方css库也需要谨慎,确保代码安全。直接上代码解析: input…

    2025年12月24日
    000
  • css实现简单时间轴的实例代码

    本文主要和大家介绍了前端css实现最基本的时间轴的示例代码,分享给大家,给大家做个参考,希望能帮助到大家。 原型: 代码: 状态详情 #timeleft p { height: 65px; color: #333333; } #timecenter p { height: 65px; color: …

    2025年12月24日 好文分享
    000
  • CSS实现动态气泡背景代码分享

    本文主要和大家介绍了css 动画实现动态气泡背景的方法的相关资料,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧,希望能帮助到大家。 今天的第一个任务是写个登录页面,老大给了我一个参(chao)考(xi)案例,大家点击链接就能看到。嗯,这个登录页面确实很简洁、大方,尤其是…

    2025年12月24日
    000
  • css垂直居中实现代码

    本文主要和大家分享css垂直居中实现代码,希望本文css代码能帮助到大家。 1.如果是单行文本, line-height 的值和height相等 案例如下: 立即学习“前端免费学习笔记(深入)”; .verticle{ height: 100px; line-height: 100px;} 2.已知…

    好文分享 2025年12月24日
    000
  • 介绍CSS3中的几个新技术

    网页制作Webjx文章简介:网页教学网将在这篇文章向大家展示CSS中的5个有趣的新技术:圆角、个别圆角、不透明度、阴影和调整元素大小.            CSS是众所周知且应用广泛的网站样式语言,在它的版本三(CSS3)计划中,新增了一些能够节省时                        …

    2025年12月23日
    000
  • html5怎么导视频_html5用video标签导出或Canvas转DataURL获视频【导出】

    HTML5无法直接导出video标签内容,需借助Canvas捕获帧并结合MediaRecorder API、FFmpeg.wasm或服务端协同实现。MediaRecorder适用于WebM格式前端录制;FFmpeg.wasm支持MP4等格式及精细编码控制;服务端方案适合高负载场景。 如果您希望在网页…

    2025年12月23日
    300
  • 如何查看编写的html_查看自己编写的HTML文件效果【效果】

    要查看HTML文件的浏览器渲染效果,需确保文件以.html为扩展名保存、用浏览器直接打开、利用开发者工具调试、必要时启用本地HTTP服务器、或使用编辑器实时预览插件。 如果您编写了HTML代码,但无法直观看到其在浏览器中的实际渲染效果,则可能是由于文件未正确保存、未使用浏览器打开或文件扩展名设置错误…

    2025年12月23日
    400
  • html5怎么打包运行_HT5用Webpack或Gulp打包后浏览器打开运行【打包】

    应通过 HTTP 服务运行打包后的 HTML5 页面,而非双击打开:一、Webpack 配 webpack-dev-server 启动本地服务;二、Gulp 配 BrowserSync 提供实时重载;三、用 Python/Node.js 轻量 HTTP 工具托管 dist 目录;四、仅当必须双击运行…

    2025年12月23日
    000

发表回复

登录后才能评论
关注微信