索引的概念

发表于2017-03-20|更新于2026-05-01|索引

|总字数:271|阅读时长:1分钟|浏览量:

索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分)，

它们包含着对数据表里所有记录的引用指针。

索引是一种数据结构。

数据库索引，是数据库管理系统中一个排序的数据结构，以协助快速查询、更新数据库表中数据。

索引的实现通常使用B树及其变种B+树。

更通俗的说，索引就相当于目录。

为了方便查找书中的内容，通过对内容建立索引形成目录。

而且索引是一个文件，它是要占据物理空间的。

MySQL索引的建立对于MySQL的高效运行是很重要的，索引可以大大提高MySQL的检索速度。

比如我们在查字典的时候，前面都有检索的拼音和偏旁、笔画等，

然后找到对应字典页码，

这样然后就打开字典的页数就可以知道我们要搜索的某一个key的全部值的信息了。

文章作者: Michael

文章链接: https://mikeah2011.github.io/post/01_MySQL/%E7%B4%A2%E5%BC%95/%E6%A6%82%E5%BF%B5.html

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Michael's Blog！

相关推荐

回表查询时一些字段值拿不到，需要到主键索引B+树再查一次。根据索引进行条件查询，回到主键索引树进行搜索的过程因为查询还要回表一次，再次查询主键索引树，所以实际中应该尽量避免回表的产生。解决回表问题可以建立联合索引进行索引覆盖，如图所示根据name字段查询用户的name和sex属性出现了回表问题：那么我们可以建立下面这个联合索引来解决： 123456create table user ( id int primary key, name varchar(20), sex varchar(5), index(name, sex)) engine = innodb; 建立了如上所示的index(name,sex)联合索引，在二级索引的叶子结点的位置就会同时也出现sex字段的值，因为能够获取到要查询的所有字段，因为就不用再回表查询一次。强制索引 force index

索引采用的算法

索引为什么采用B+树，而不用B-树，红黑树提升查询速度，首先要减少磁盘I/O次数，也就是要降低树的高度。平衡二叉树、红黑树，都属于二叉树。时间复杂度为O(n)，当表的数据量上千万时，树的深度很深，mysql读取时消耗大量 IO。另外，InnoDB引擎采用页为单位读取，每个节点一页，但是二叉树每个节点储存一个关键词，导致空间浪费。 B-树，非叶子节点存储数据，占用较多空间，导致每个节点的指针少很多，无形增加了树的深度。 B+树数据都存储在叶子节点，非叶子节点只存储健值+指针，索引树更加扁平，三层深度可以支持千万级表存储。同时叶子节点之间通过链表关联，范围查找更快。

索引的最左前缀原则

最左前缀原则就是最左优先，在创建多列索引时，要根据业务需求， where子句中使用最频繁的一列放在最左边。 mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配，比如a = 1 and b = 2 and c > 3 and d = 4 如果建立(a,b,c,d)顺序的索引，d是用不到索引的，如果建立(a,b,d,c)的索引则都可以用到， a,b,d的顺序可以任意调整。 =和in可以乱序，比如a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意顺序， mysql的查询优化器会帮你优化成索引可以识别的形式。最左前缀原则可以是联合索引的的最左N个字段，也可以是字符串索引的最左的M个字符。举个例子，假如现在有一个表的原始数据如下所示：并根据col3 ，col2的顺序建立联合索引，此时联合索引树结构如图下所示：叶子结点中首先会根据col3的字符进行排序，若是col3相等，在col3相等的值里面再对col2进行排序，假如...

索引失效的 12 种原因

一句话索引失效 = MySQL 优化器决定不用你建的索引去执行。永远用 EXPLAIN 验证，不要靠记忆。 12 种失效场景1. WHERE 列上做函数 / 表达式1234567-- ❌ 索引失效SELECT * FROM users WHERE YEAR(created_at) = 2024;SELECT * FROM users WHERE id + 1 = 100;-- ✅ 改写：把函数挪到右边SELECT * FROM users WHERE created_at >= '2024-01-01' AND created_at < '2025-01-01';SELECT * FROM users WHERE id = 99; MySQL 8.0+ 支持函数索引：ALTER TABLE users ADD INDEX idx_year ((YEAR(created_at))) 2. 隐式类型转换123456-- 字段是 VARCHAR，传了 INT-- ❌ 走全表扫SELECT * FROM...

索引底层实现

Hash索引基于哈希表实现，只有精确匹配索引所有列的查询才有效，对于每一行数据，存储引擎都会对所有的索引列计算一个哈希码（hash code），并且Hash索引将所有的哈希码存储在索引中，同时在索引表中保存指向每个数据行的指针。 B-Tree索引（MySQL使用B+Tree） B-Tree能加快数据的访问速度，因为存储引擎不再需要进行全表扫描来获取数据，数据分布在各个节点之中。 B+Tree索引是B-Tree的改进版本，同时也是数据库索引索引所采用的存储结构。数据都在叶子节点上，并且增加了顺序访问指针，每个叶子节点都指向相邻的叶子节点的地址。相比B-Tree来说，进行范围查找时只需要查找两个节点，进行遍历即可。而B-Tree需要获取所有节点，相比之下B+Tree效率更高。 B+tree性质： n棵子tree的节点包含n个关键字，不用来保存数据而是保存数据的索引。所有的叶子结点中包含了全部关键字的信息，及指向含这些关键字记录的指针，且叶子结点本身依关键字的大小自小而大顺序链接。所有的非终端结点可以看成是索引部分，结点中仅含其子树中的最大（或最小）关键字。 B+ 树中，...

索引的类型

从存储结构上来划分： BTree索引（B-Tree或B+Tree索引）； Hash索引； full-index全文索引； R-Tree索引这里所描述的是索引存储时保存的形式从应用层次来分：主键索引；普通索引；唯一索引；复合索引(联合索引)；空间索引；根据中数据的物理顺序与键值的逻辑（索引）顺序关系：聚集索引(聚族索引)；非聚集索引(非聚族索引)；总结索引类型概念普通索引一个索引只包含一个列，一个表可以有多个单列索引唯一索引索引列的值必须唯一，但允许有空值复合索引多列值组成一个索引，专门用于组合搜索，其效率大于索引合并聚簇索引也称为主键索引，是一种数据存储方式。B+Tree结构，非叶子节点包含健值和指针，叶子节点包含索引列和行数据。一张表只能有一个聚簇索引。非聚簇索引不是聚簇索引，就是非聚簇索引。叶子节点只是存索引列和主键id。如果sql还要返回除了索引列的其他字段信息，需要回表，第一次索引一般是顺序IO，回表的操作属于随机IO。回表的次数越多，性能越差

评论