MySQL 回表,覆盖索引,索引下推

回表

在研究mysql二级索引的时候,发现mysql回表这个操作,往下研究了一下

字面意思,找到索引,回到表中找数据

解释一下就是:

先通过索引扫描出数据所在的行,再通过行主键id 取出数据。

举个例子说明:

select * from innodb_user
where age = 18 and user_name like '模糊查%';

假如ageuser_name两个字段是个联合索引,我们通过age=18这个索引找到了二级索引树对应页所在的数据,但是由于user_name是模糊查询,导致了这个字段的索引失效,我们得到了二级索引的这一页中age=18的很多个数据(主键id),我们通过这些主键id回到主键索引树里再查表里的数据,这个操作就是回表。

另外回表的产生也是需要一定条件的,如果一次索引查询就能获得所有的select 记录(也就是联合索引已经包含了你查的字段)就不需要回表,如果select 所需获得列中有其他的非索引列,就会发生回表动作。即基于非主键索引的查询需要多扫描一棵索引树。

另外上面所说的不需要回表,其实还有另一个名词

覆盖索引

就是我们需要查询的数据都在二级索引树中,直接返回这种情况就叫做覆盖索引。

上面提到的联合索引、二级索引树、主键索引树这些名词,如果同学们还没有啥概念,请看我写的这一篇文章,详细介绍了mysql的索引
链接: mysql索引详解及演进过程及面试题延伸

索引下推

索引下推(index condition pushdown )简称icp,在mysql5.6以后的版本上推出,用于优化回表查询;

在不使用icp的情况下,在使用非主键索引(又叫普通索引或者二级索引)进行查询时,存储引擎通过索引检索到数据,然后返回给mysql服务器,服务器然后判断数据是否符合条件 ;

在使用icp的情况下,如果存在某些被索引的列的判断条件时,mysql服务器将这一部分判断条件传递给存储引擎,
然后由存储引擎通过判断索引是否符合mysql服务器传递的条件,只有当索引符合条件时才会将数据检索出来返回给mysql服务器 ;

索引条件下推优化可以减少存储引擎查询基础表的次数,也可以减少mysql服务器从存储引擎接收数据的次数。

举个栗子:

drop table if exists `t_user`;
create table `t_user` (
  `id` bigint not null auto_increment comment '主键',
  `name` varchar(64) not null comment '用户名 ',
  `age` int(8) not null comment '年纪',
	`address` varchar(255) default null comment '地址',
  `is_delete` tinyint not null default '0' comment '是否删除 默认否',
  `create_time` datetime default current_timestamp comment '创建时间',
  primary key (`id`),
  key `idx_name_age` (`name`,`age`)
) engine=innodb default charset=utf8mb4 collate=utf8mb4_0900_ai_ci comment='用户信息表';
-- 初始化数据 
insert into `t_user`(`name`, `age`, `address`) values ('李四', 22, '中国');
insert into `t_user`(`name`, `age`, `address`) values ('李五', 22, '中国');
insert into `t_user`(`name`, `age`, `address`) values ('李六', 23, '中国');
insert into `t_user`(`name`, `age`, `address`) values ('张三', 24, '中国');
insert into `t_user`(`name`, `age`, `address`) values ('李期', 24, '中国');

用上面的语句建一个测试用的表

无索引下推: 查看索引下推的状态

show variables like '%optimizer_switch%';
-------------------------------------------------------
optimizer_switch	index_merge=on,index_merge_union=on,index_merge_sort_union=on,index_merge_intersection=on,engine_condition_pushdown=on,index_condition_pushdown=on,mrr=on,mrr_cost_based=on,block_nested_loop=on,batched_key_access=off,materialization=on,semijoin=on,loosescan=on,firstmatch=on,duplicateweedout=on,subquery_materialization_cost_based=on,use_index_extensions=on,condition_fanout_filter=on,derived_merge=on,use_invisible_indexes=off,skip_scan=on,hash_join=on,subquery_to_derived=off,prefer_ordering_index=on,hypergraph_optimizer=off,derived_condition_pushdown=on

关闭索引下推:

索引下推是mysql 5.6优化查询回表的功能,在5.6之前都不支持索引下推,笔者用的8.0,则需要先关闭索引下推:
set optimizer_switch='index_condition_pushdown=off';

执行sql;

explain select * from t_user where name like '李%' and age = 22;

分析一下以上sql执行的过程:

  • 1. idx_name_age`组合索引 遵循最左匹配遇到非等值判断时匹配停止,name的范围查询则会使age这个条件就不会走索引;
  • 2. 会先在name索引上顺序找到 符合条件的name和id数据;
  • 3. 然后通过id在聚簇索引上回表找到对应的age数据,将结果存放在临时表中;
  • 4. 最后在临时表中通过age条件来筛选数据。

以上过程会扫描4条记录,回表4次。
extra = using where:表示优化器需要通过索引回表查询数据。

有索引下推: 开启索引下推

set optimizer_switch='index_condition_pushdown=on';

执行sql:

explain select * from t_user where name like '李%' and age = 22;

开启索引下推优化后再分析一下以上sql执行的过程:

  • 1. 由于开启了索引下推会在idx_name_age索引上同时检索满足name和age的条件的数据的id;
  • 2. 再用id到聚簇索引上查询完整的数据。

以上过程会扫描4行数据,回表次数是2次。

extra = using index condition 表示索引下推。

总结:

  • 索引下推功能是mysql 5.6推出优化回表的操作,只支持向上兼容,低版本是不支持的;
  • 索引下推优化的只是回表次数,扫描行数还是一样的。

到此这篇关于mysql 回表,覆盖索引,索引下推的文章就介绍到这了,更多相关mysql 回表内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com!

“张承辉博客” MySQL 回表,覆盖索引,索引下推 https://www.zhangchenghui.com/267389

(0)
上一篇 2022年7月20日 下午9:59
下一篇 2022年7月20日 下午9:59

相关阅读

发表回复

登录后才能评论