当前位置：首页 > news >正文

有没有想过：为什么索引能加快查询速度？深入 B+ 树原理，小白也能秒懂！

news 2026/4/2 2:13:01

视频看了几百小时还迷糊？关注我，几分钟让你秒懂！

很多开发者会用索引，但一问“为什么索引快？”就支支吾吾。今天我们就抛开黑盒，用Java + Spring Boot的视角，结合生活化类比和底层原理，彻底搞懂这个问题。

一、没有索引时：全表扫描 = 翻整本字典

假设你有一张用户表user_info，100 万条数据：

CREATE TABLE user_info ( id BIGINT PRIMARY KEY, phone VARCHAR(20), name VARCHAR(50) );

现在你要查手机号为138****1234的用户：

SELECT * FROM user_info WHERE phone = '138****1234';

❌ 没有索引的情况

数据库只能一行一行地从磁盘读取数据，直到找到匹配项 —— 这叫全表扫描（Full Table Scan）。

最坏情况：查到最后一条才找到 → 扫描 100 万行
平均情况：也要扫 50 万行
每次磁盘 I/O 都很慢（机械硬盘约 10ms/次）

💥 100 万次 I/O？那不得卡死！

二、有了索引后：像查字典目录一样快

我们给phone加个普通索引：

ALTER TABLE user_info ADD INDEX idx_phone (phone);

这时 MySQL（InnoDB 引擎）会为phone列构建一棵B+ 树。

✅ B+ 树长什么样？（简化版）

想象一棵三层的树：

[130... | 150... | 180...] / | \ [1300000...1309999] [1500000...1509999] [1800000...1809999] | | | 实际数据指针 实际数据指针 实际数据指针

非叶子节点：只存索引值（如手机号区间），用于快速导航
叶子节点：存完整的索引值 + 主键（或行指针），并且双向链表连接

🔍 查询过程（以`138****1234`为例）：

从根节点开始：138...属于130... ~ 150...区间 → 走中间分支
到第二层：定位到1380000 ~ 1389999的页
在叶子节点中二分查找，快速定位到138****1234
通过主键（或聚簇索引）回表拿到完整行数据（如果是覆盖索引则不用回表）

✅ 整个过程只需3 次磁盘 I/O（树高为 3），而不是 50 万次！

📌 关键点：B+ 树高度低、扇出大（一个节点可存上千个指针），所以查询效率极高

三、用 Java 模拟 B+ 树查找 vs 线性查找

虽然真实 B+ 树复杂，但我们用简化代码感受差距：

import java.util.*; public class IndexSimulation { // 模拟 100 万用户数据（无序） static List<User> users = new ArrayList<>(); // 模拟 phone -> id 的 B+ 树索引（用 TreeMap 近似） static TreeMap<String, Long> phoneIndex = new TreeMap<>(); static { // 初始化数据 for (long i = 1; i <= 1_000_000L; i++) { String phone = "138" + String.format("%07d", i); users.add(new User(i, phone, "User" + i)); phoneIndex.put(phone, i); // 构建索引 } } // 无索引：线性查找 public static User findByPhoneWithoutIndex(String targetPhone) { for (User user : users) { if (user.getPhone().equals(targetPhone)) { return user; } } return null; } // 有索引：TreeMap（红黑树，近似 B+ 树的有序查找） public static User findByPhoneWithIndex(String targetPhone) { Long id = phoneIndex.get(targetPhone); if (id != null) { // 实际数据库会通过主键回表，这里简化 return users.get((int)(id - 1)); } return null; } public static void main(String[] args) { String target = "138500000"; long start1 = System.currentTimeMillis(); User u1 = findByPhoneWithoutIndex(target); long time1 = System.currentTimeMillis() - start1; long start2 = System.currentTimeMillis(); User u2 = findByPhoneWithIndex(target); long time2 = System.currentTimeMillis() - start2; System.out.println("无索引耗时: " + time1 + " ms"); System.out.println("有索引耗时: " + time2 + " ms"); // 输出示例： // 无索引耗时: 15 ms // 有索引耗时: 0 ms } static class User { private Long id; private String phone; private String name; // 构造方法、getter 省略 public User(Long id, String phone, String name) { this.id = id; this.phone = phone; this.name = name; } public String getPhone() { return phone; } } }

💡 虽然TreeMap是红黑树，不是 B+ 树，但它体现了有序结构 + 快速查找的核心思想。

在真实数据库中，B+ 树更适合磁盘存储（节点大小 = 16KB，一次 I/O 读一页），而红黑树适合内存。

四、Spring Boot 中如何验证索引生效？

1. 开启 SQL 日志（application.yml）

logging: level: com.yourpackage.mapper: debug

2. 使用`EXPLAIN`分析

// 在 Mapper 中加一个 explain 方法（仅开发环境用） @Select("EXPLAIN SELECT * FROM user_info WHERE phone = #{phone}") List<Map<String, Object>> explainFindByPhone(@Param("phone") String phone);

调用后你会看到：

字段	说明
`type`	`ref`表示使用了索引
`key`	`idx_phone`表示命中了哪个索引
`rows`	扫描行数（理想是 1）

如果type=ALL，说明没走索引！

五、常见误区：以为加了索引就一定快？

❌ 反例 1：对索引列使用函数

-- 索引失效！ SELECT * FROM user_info WHERE UPPER(phone) = '138****1234';

❌ 反例 2：模糊查询左通配

-- 索引失效！ SELECT * FROM user_info WHERE phone LIKE '%1234';

✅ 正确写法：

-- 右通配可以走索引 SELECT * FROM user_info WHERE phone LIKE '138%';

❌ 反例 3：联合索引不遵循最左前缀

-- 有索引 (name, phone)，但只查 phone → 不走索引 SELECT * FROM user_info WHERE phone = '138****1234';

六、为什么 B+ 树比哈希、二叉树更适合数据库？

数据结构	是否适合数据库索引	原因
哈希表	❌	只支持等值查询，不支持范围（如`WHERE create_time > ?`）
二叉搜索树	❌	树太高（100 万数据 → 高度约 20），I/O 太多
B 树	⚠️	非叶子节点存数据，导致一页存的指针少，树更高
B+ 树	✅	所有数据在叶子节点 + 叶子链表 + 非叶子只存索引 → 树更矮、范围查询快

InnoDB 选择 B+ 树，就是因为它兼顾等值、范围、排序查询，且磁盘友好。

七、总结：索引快的本质

对比项	无索引	有索引（B+ 树）
查找方式	线性扫描	树形分治
时间复杂度	O(N)	O(log N)
磁盘 I/O 次数	几十万次	通常 2~4 次
范围查询	慢	快（叶子节点链表）
内存占用	无额外	需要存储索引结构