当前位置：首页 > news >正文

mysql核心知识清单

news 2026/7/7 14:58:25

索引

数据结构

联合索引

回表

如何处理慢sql

会走哪个索引？

事务

什么是事务

如何实现事务

事务的隔离级别

主从、集群

主从

集群

分库分表

什么时候分库分表

如何分库分表

分库分表技术

分库分表带来的问题

索引

数据结构

B+树，将一条链路的数据挂在叶子节点上的B树：

联合索引

先按照第一个索引排序，第一个索引的值相同时，按照第二个索引排序，以此类推。

回表

innodb中的索引结构都是B+树，但是既有聚集索引，也有非聚集索引。

聚集索引：

B+树的叶子节点上挂的是数据。主键索引是聚集索引，如果没有主键索引，会默认给每个数据行维护一个RowId，用这个RowId来建立一个聚集索引。

innodb从诞生之初，即遵循“索引即数据，数据即索引”的概念，所以，聚集索引的叶子节点，每一个都记录着对应的完整的数据行的内容。

非聚集索引：

B+树的叶子节点上挂的是对应的聚集索引的值。普通索引是非聚集索引。

回表：

通过非聚集索引（主键索引之外的普通索引）来查询时，会先走非聚集索引的B+树，拿到聚集索引的索引值，再去聚集索引的B+树查询对应数据。存在查两个B+树的情况，额外多一轮磁盘IO。

回表明显是基于空间和时间取平衡的一个做法，如果每个索引的树都用聚集索引，可能占的空间会很大，所以牺牲一点时间性能换回了一点空间。

索引下推：

MySQL5.6版本开始，非聚集索引断裂、走不下去后，不会立即回表，还会向下推一步再继续比较其它索引字段，从而减少无意义的额外IO。

如何处理慢sql

定位：

MySQL自身配置中支持开启慢sql监控，常用的数据源也支持开启慢sql的监控，先通过监控把慢sql抓出来。

分析：

通过explain来分析执行计划来分析慢sql，主要看几个关键字段用EXPLAIN看type（别全表扫）、看key（走了哪个索引）、看rows（扫了多少行）、看Extra（有没有Using filesort/temporary）

优化：

如果分析出来是索引的问题就建索引，如果不是索引的问题，有可能是表里面存的数据不适合存在关系型数据库中，如大json，这时候需要评估是不是要拆数据。

会走哪个索引？

如果一个字段存在于两个索引中，会由索引选择器去选择索引效率高的那个。

事务

什么是事务

在实际工程中发现，数据库要实现ACID，才能满足各种场景需求，也就是原子性、一致性、隔离性、持久性。

持久性通过将数据存在磁盘中来实现，原子性、一致性、隔离性，说白了就是：要保证数据库中数据的版本不能出现中间状态，对数据库的一次“原子操作”，要么全部成功，要么全部失败，就能实现数据库数据版本的干净。所以引入了事务的概念。

事务：一组sql操作要么全部成功，要么全部失败。

讲道理来说，实现事务之间强制的隔离，保证并发的绝对安全就可以了，只是多数数据库在实现的时候发现很多场景要不了太高的隔离度，并且隔离度和吞吐量之间是永远呈反比的关系，为了让开发者自动去取舍吞吐量和隔离度，于是引入了隔离级别，允许手动去控制隔离的度。

mysql事务和存储引擎直接相关，只有innodb支持事务。所以所有事务的讨论都是基于表是innodb引擎的。

如何实现事务

为了保证并发时候的吞吐量，所以mysql实现事务的时候没有直接用锁，而是用了MVCC。

mysql会为innodb中的数据行维护一个隐藏的DB_TRX_ID字段，记录操作这条数据的事务的ID。

每一个未提交事务都会维护一个ReadView，每一个未提交事务单独是一个ReadView，ReadView+undolog来实现MVCC。

ReadView里面会记录：

min_trx_id，活跃的最小事务ID，所谓活跃事务就是未提交的事务，innodb会有个数据结构来维护事务ID的集合的，里面会标记哪些事务是活跃事务，去这个里面拿活跃的最小事务的ID即可。
max_trx_id，未开始事务ID，也就是去innodb维护的那个事务ID的集合里面拿最大的，然后+1。
creator_trx_id，当前事务ID

因为ReadView里面维护了以上几个事务ID，所以去undolog中读数据的时候，就能配合隔级别知道哪些数据是能读的。

事务的隔离级别

并发场景下，数据库会有三种问题：

脏读，一个事务读到另一个未提交的事务的数据。
不可重复读，同一个事务前后读同一个数据，读到的值不一样。和脏读不一样，引起不可重复读问题的原因是在两次读之间另一个提交的事务修改了数据。
幻读，同一事务前后查到的符合条件的结果集不同。比如查age>20，，第一次查到的是10条，间隙另一事务提交新增一条符合的数据，第二次查到11条。和脏读不一样，脏读是具体某个数据，幻读是查符合条件的数据集。

MySQL的innodb提供了几种隔离级别来应对以上情况：