当前位置: 首页 > news >正文

Mysql--基础知识点--112--聚簇索引和非聚簇索引

你问的应该是B 树B+ 树的区别(“B数”是笔误)。这两种都是平衡多路搜索树,广泛用于数据库和文件系统,但结构上有几个关键不同。

核心区别一览

特性B 树B+ 树
数据存储位置所有节点(内部节点 + 叶子节点)都存储数据只有叶子节点存储数据,内部节点只存键(及指针)
叶子节点结构独立,无相互链接所有叶子节点通过双向链表串联
查询稳定性不同数据查询的 I/O 次数可能不同(数据可能在根节点)每次查询都必须走到叶子节点,I/O 次数稳定(等于树高)
范围查询效率较低,需要反复回溯父节点效率极高,从叶子链表直接遍历
空间利用率每个节点都存数据,节点容纳的键数量少内部节点不存数据,可容纳更多键 → 树更矮 → I/O 更少

详细解释

1. 数据分布不同

  • B 树:每个节点既存放索引键,也存放对应的数据行地址(或完整数据)。查找时,如果命中某个内部节点,直接返回数据,不一定到叶子层。
  • B+ 树:内部节点只存放键和指向子节点的指针,数据全在叶子节点。所以查找任何数据都必须走到叶子节点。

2. 叶子节点链表

  • B 树:叶子节点之间没有指针连接。
  • B+ 树:所有叶子节点按键大小顺序,用双向链表相连。这使得范围查询(如WHERE id BETWEEN 10 AND 100)极其高效:找到起始叶子后,沿着链表向后扫描即可,无需反复回溯树结构。

3. 查询性能特征

  • B 树:最好情况(命中根节点)只需 1 次 I/O,最坏情况需要树高次 I/O。因此查询时间不稳定
  • B+ 树:任何查询都需要树高次 I/O(比如 3 次),时间稳定。对于数据库而言,稳定意味着可预测性高,对事务处理更友好。

4. 节点存储能力

  • 假设磁盘页大小为 16KB,键占 8 字节,指针占 6 字节,数据行占 200 字节。
  • B 树:每个节点因为存数据,能放的键数量少 → 树更高 → 查找 I/O 次数多。
  • B+ 树:内部节点只存键和指针,可放几千个键 → 树通常只有 2-4 层 → I/O 次数少且稳定。

为什么 MySQL InnoDB 使用 B+ 树?

  • 更适合范围查询:叶子链表支持高效区间扫描和分页。
  • 更高的扇出(fanout):内部节点不存数据,可大幅降低树高,减少磁盘 I/O。
  • 缓存友好:内部节点可以全部缓存在内存中,查询只需要很少的磁盘读取。
  • 查询性能稳定:避免“好运气”和“坏运气”的巨大差异。

一个直观的例子

假设有一棵高度为 3 的树:

  • B 树:可能根节点就存了数据,查它只要 1 次读盘;但也可能数据在叶子,需要 3 次。
  • B+ 树:任何数据都在第 3 层,永远需要 3 次读盘(根节点常驻内存的话实际 2 次)。虽然看起来“最坏”和 B 树一样,但没有波动,并且范围扫描时 B+ 树完胜。

总结:B+ 树 = B 树 + 叶子链表 + 内部节点不存数据。数据库索引几乎都选 B+ 树,正是因为它对磁盘 I/O 和范围查询做了极致优化。

http://www.jsqmd.com/news/895107/

相关文章:

  • 模型安全扫描器失效:29种绕过技术揭示PyTorch与Hugging Face模型加载风险
  • AI智能体实战指南:从核心架构到LangChain搭建全解析
  • CentOS 7服务器配置实录:用yum安装PHP 8.1并搞定常用扩展(bcmath, gd, pdo_mysql...)
  • NSSM实战:除了基础注册,这些高级配置让你的Windows服务更稳定(日志、重启、权限篇)
  • 【干细胞突破性进展】中国科学家发现“全能开关”基因,改写再生医学未来!2026最新研究深度解读
  • 薄膜铌酸锂光波导 vs 传统铌酸锂波导:基于台阶仪的波导刻蚀深度与损耗差异分析
  • 源启重大,智创未来 | AtomGit「源启高校」计划重庆大学站圆满落幕!
  • 打印机租赁的“进化简史”
  • Spectrasonics Trilian 1.6.6D:音乐人公认的四大顶级贝斯合成器之一,全面解析与下载
  • 具有当地特色的日照海鲜餐厅推荐
  • AI智能体架构优化:将LLM移出检索路径,提升性能与降低成本
  • 用Python和Keras从零搭建CNN:一个医学影像识别课程设计的踩坑与调优实录
  • Anthropic的“部署即收购”:企业AI如何通过私募股权网络实现指数级增长
  • 商品详情接口高并发架构:独立资源池与并发控制实战
  • 从‘free’命令看Linux内存管理:你的服务器内存真的‘不够用’吗?
  • 智能语音识别与多语言实时同传方案:从语音转文字到跨语言实时沟通
  • 手机信号栏突然冒出个5GA,这到底是什么谜之黑话?
  • Windows 10/11 用户福音:手把手教你用注册表让OneDrive选择性同步(避开那些烦人的临时文件)
  • 保姆级教程:用DPABI和Matlab给脑图做‘分区体检’,提取AAL90模板特征
  • 【应用程序】基于 Spring Boot + Spring AI的虚拟宠物Web 应用(二)
  • Spark SQL 窗口函数完整技术文档
  • 传统喷绘还在跟“色差”较劲,会被替代吗
  • 智能体安全授权新范式:便携式作用域令牌设计与实现
  • 字节AI布局
  • wsl2+ubuntu22.04配置docker代理
  • 保姆级教程:用CUDA 12.x的异步流和事件,手把手优化你的PyTorch数据预处理流水线
  • Django 从 0 到 1 打造完整电商平台:商品缓存优化(Redis)
  • 智能体评估误区:为何Token消耗不是衡量AI工作价值的关键指标
  • 内网环境RPA自动化实践:自定义API与离线运行方案
  • 48小时基于Google Cloud构建多智能体AI系统:架构、实现与优化