社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  DATABASE

MySQL范围查找时,索引失效问题探究

IT牧场 • 2 年前 • 250 次点击  

点击下方“IT牧场”,选择“设为星标”

来源:blog.csdn.net/qq_25188255/

article/details/81316498

1 问题描述

本文对建立好的复合索引进行排序,并取记录中非索引字段,发现索引不生效,例如,有如下表,DDL语句为:

CREATE TABLE `employees` (
  `emp_no` int(11NOT NULL,
  `birth_date` date NOT NULL,
  `first_name` varchar(14NOT NULL,
  `last_name` varchar(16NOT NULL,
  `gender` enum('M','F'NOT NULL,
  `hire_date` date NOT NULL,
  `age` int(11NOT NULL,
  PRIMARY KEY (`emp_no`),
  KEY `unique_birth_name` (`first_name`,`last_name`USING BTREE
  ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

复合索引为unique_birth_name (first_name,last_name) 。使用以下语句:

EXPLAIN SELECT
    gender
FROM
    employees
ORDER BY
    first_name,
    last_name

根据上图:type:all 及 Extra:Using filesort 可得,索引没有生效。

继续进行试验,对查询语句进一步改写,加上一个范围查找:

EXPLAIN SELECT
    gender
FROM
    employees
WHERE first_name > 'Leah'
ORDER BY
    first_name,
    last_name

执行计划显示如下图:

这里发现结果和第一次sql分析无异。继续试验。

改写sql语句:

EXPLAIN SELECT
    gender
FROM
    employees
WHERE first_name > 'Tzvetan'
ORDER BY
    first_name,
    last_name

此时,令人惊讶的是,索引生效了。

2 问题分析

此时,我们做一个大胆的猜测:

第一次进行sql分析时,因为第一次order by 后,得到的还是全表数据,如果根据复合索引中携带的主键查找每一个gender进行拼接,自然很费资源和时间,mysql不会做如此蠢的事。不如直接进行全表扫描,把扫描到的每条数据和order by得到的临时数据进行拼接,从而得到需要的数据。

学习资料:Java进阶视频资源

为了验证上述想法的正确性,我们对三次sql进行分析。

第一次sql根据复合索引得到的数据量为:300024,为全表数据

SELECT
    COUNT(first_name)
FROM
    employees
ORDER BY
    first_name,
    last_name

第二次改写的sql根据复合索引得到的数据量为:159149 , 为全表数据量的1/2。

SELECT
    COUNT(first_name)
FROM
    employees
WHERE first_name > 'Leah'
ORDER BY
    first_name,
    last_name

第三次改写的sql根据复合索引得到的数据量为:36731, 为全表数据量的1/10。

SELECT
    COUNT(first_name)
FROM
    employees
WHERE first_name > 'Tzvetan'
ORDER BY
    first_name,
    last_name

通过对比发现,第二次改写的sql根据复合索引得到的数据量是全表数据量的1/2。此时还没有达到mysql使用索引进行二次查找的量级。

第三次改写的sql根据复合索引得到的数据量是全表数据量的1/10,达到了mysql使用索引进行二次查找的量级,于是从执行计划上可以看到,第三次改写sql是走了索引的。

3 总结

mysql 是否根据首次索引条件查询出的主键进行二次查找,也是要看查询出来的数据量级,如果数据量接近全表数据量的话,就会进行全表扫描,否则根据第一次查询出来的主键进行二次查询。

干货分享

最近将个人学习笔记整理成册,使用PDF分享。关注我,回复如下代码,即可获得百度盘地址,无套路领取!

001:《Java并发与高并发解决方案》学习笔记;002:《深入JVM内核——原理、诊断与优化》学习笔记;003:《Java面试宝典》004:《Docker开源书》005:《Kubernetes开源书》006:《DDD速成(领域驱动设计速成)》007:全部008:加技术群讨论

加个关注不迷路

喜欢就点个"在看"呗^_^

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/122399
 
250 次点击