cache conscious B 树是如何存储的?

How is cache conscious B+tree stored?

我是数据库新手,希望实现一个具有缓存意识的 B 树。许多阅读建议将节点和叶子存储为连续内存。这是假设在创建B树时,节点和叶子都存储在堆中,然后通过读写操作复制到磁盘中吗?有缓存意识的 B 树是否告诉操作系统给它一组连续的物理页面?我认为答案是没有 b/c 应用程序不应该知道物理页面是如何分配的,而连续内存仅指主内存页面?


"缓存意识"位是指页面布局的一种特殊规则,它试图最大限度地利用 CPU 的第一级数据缓存,通常针对特定的缓存行大小(例如 64 字节)进行优化。

一种标准技术(与高速缓存行大小无关)是在间接向量中使用偏移值编码,通常与"穷人的规范化密钥"结合使用(例如,通常从第一个字节开始的两个或四个字节的密钥材料不与前任共享)。这减少了访问间接向量之外的数据的必要性 - 即保存在页面其他位置的堆中的实际关键数据,并且可以仅使用增强的数据中包含的数据来完成相当多的查询(失败的搜索)间接向量。这可以最大限度地提高缓存利用率并最大限度地减少抖动。

其他方案将间接向量的元素形成一个 mini-btree,其"页面大小"等于缓存行大小。

另一种方案将间接向量划分为一个(或很少)缓存行大小的子块,前缀截断(在某些论文中称为"前压缩")仅在这些子块内使用,而不是跨不同块使用.块"领导者"之间的二进制搜索用于识别目标块,然后以前缀截断键序列的典型方式对其进行线性扫描。

该方案的一种变体将块领导存储在一个迷你索引中,并将顺序子块保存在其他地方,以进一步提高缓存利用率。不用说,页内空间管理绝对是一场噩梦。

许多其他变体是可能的,但出版物似乎仅限于试图证明学术观点的学术论文,并且很少窥视重要数据库系统使用的页面布局。

即使对于与前缀截断相关的键比较这样基本的东西,我能在网络上找到的唯一严肃参考可以追溯到 1990 年:

DDJ 1990 年 12 月 - 增压顺序搜索

对 btree 的 CPU 缓存问题有很好的概述的论文:

  • B-tree 索引和 CPU 缓存(Goetz Graefe 和 Per-?…ke Larson)
  • 主内存数据库的缓存感知索引结构 (Vilho Raatikka)
  • 使 B 树在主内存中缓存有意识(Jun Rao 和 Kenneth Ross)

对底层存储的分页性质的认识——以及寻道、页面读/写和批量读/写的不同特性——是一种不同的野兽,但也很重要。它通常会产生令人惊讶的创新设计。一个例子是 Berkeley DB 的 Java 版本,它只将其日志文件保存到磁盘,并在启动时从日志中重建内存中的 btree。


相关推荐

  • Spring部署设置openshift

    Springdeploymentsettingsopenshift我有一个问题让我抓狂了三天。我根据OpenShift帐户上的教程部署了spring-eap6-quickstart代码。我已配置调试选项,并且已将Eclipse工作区与OpehShift服务器同步-服务器上的一切工作正常,但在Eclipse中出现无法消除的错误。我有这个错误:cvc-complex-type.2.4.a:Invali…
    2025-04-161
  • 检查Java中正则表达式中模式的第n次出现

    CheckfornthoccurrenceofpatterninregularexpressioninJava本问题已经有最佳答案,请猛点这里访问。我想使用Java正则表达式检查输入字符串中特定模式的第n次出现。你能建议怎么做吗?这应该可以工作:MatchResultfindNthOccurance(intn,Patternp,CharSequencesrc){Matcherm=p.matcher…
    2025-04-161
  • 如何让 JTable 停留在已编辑的单元格上

    HowtohaveJTablestayingontheeditedcell如果有人编辑JTable的单元格内容并按Enter,则内容会被修改并且表格选择会移动到下一行。是否可以禁止JTable在单元格编辑后转到下一行?原因是我的程序使用ListSelectionListener在单元格选择上同步了其他一些小部件,并且我不想在编辑当前单元格后选择下一行。Enter的默认绑定是名为selectNext…
    2025-04-161
  • Weblogic 12c 部署

    Weblogic12cdeploy我正在尝试将我的应用程序从Tomcat迁移到Weblogic12.2.1.3.0。我能够毫无错误地部署应用程序,但我遇到了与持久性提供程序相关的运行时错误。这是堆栈跟踪:javax.validation.ValidationException:CalltoTraversableResolver.isReachable()threwanexceptionatorg.…
    2025-04-161
  • Resteasy Content-Type 默认值

    ResteasyContent-Typedefaults我正在使用Resteasy编写一个可以返回JSON和XML的应用程序,但可以选择默认为XML。这是我的方法:@GET@Path("/content")@Produces({MediaType.APPLICATION_XML,MediaType.APPLICATION_JSON})publicStringcontentListRequestXm…
    2025-04-161
  • 代码不会停止运行,在 Java 中

    thecodedoesn'tstoprunning,inJava我正在用Java解决项目Euler中的问题10,即"Thesumoftheprimesbelow10is2+3+5+7=17.Findthesumofalltheprimesbelowtwomillion."我的代码是packageprojecteuler_1;importjava.math.BigInteger;importjava…
    2025-04-161
  • Out of memory java heap space

    Outofmemoryjavaheapspace我正在尝试将大量文件从服务器发送到多个客户端。当我尝试发送大小为700mb的文件时,它显示了"OutOfMemoryjavaheapspace"错误。我正在使用Netbeans7.1.2版本。我还在属性中尝试了VMoption。但仍然发生同样的错误。我认为阅读整个文件存在一些问题。下面的代码最多可用于300mb。请给我一些建议。提前致谢publicc…
    2025-04-161
  • Log4j 记录到共享日志文件

    Log4jLoggingtoaSharedLogFile有没有办法将log4j日志记录事件写入也被其他应用程序写入的日志文件。其他应用程序可以是非Java应用程序。有什么缺点?锁定问题?格式化?Log4j有一个SocketAppender,它将向服务发送事件,您可以自己实现或使用与Log4j捆绑的简单实现。它还支持syslogd和Windows事件日志,这对于尝试将日志输出与来自非Java应用程序…
    2025-04-161