社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  DATABASE

MySQL范围查找时,索引失效问题探究

Java编程精选 • 2 年前 • 227 次点击  
👇👇关注后回复 “进群” ,拉你进程序员交流群👇👇


来源丨blog.csdn.net/qq_25188255/

article/details/81316498

1 问题描述

本文对建立好的复合索引进行排序,并取记录中非索引字段,发现索引不生效,例如,有如下表,DDL语句为:

CREATE TABLE `employees` (
  `emp_no` int(11NOT NULL,
  `birth_date` date NOT NULL,
  `first_name` varchar(14NOT NULL,
  `last_name` varchar(16NOT NULL,
  `gender` enum('M','F'NOT NULL,
  `hire_date` date NOT NULL,
  `age` int(11NOT NULL,
  PRIMARY KEY (`emp_no`),
  KEY `unique_birth_name` (`first_name`,`last_name`USING BTREE
  ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

复合索引为unique_birth_name (first_name,last_name) 。使用以下语句:

EXPLAIN SELECT
    gender
FROM
    employees
ORDER BY
    first_name,
    last_name

根据上图:type:allExtra:Using filesort 可得,索引没有生效。

继续进行试验,对查询语句进一步改写,加上一个范围查找:

EXPLAIN SELECT
    gender
FROM
    employees
WHERE first_name > 'Leah'
ORDER BY
    first_name,
    last_name

执行计划显示如下图:

这里发现结果和第一次sql分析无异。继续试验。

改写sql语句:

EXPLAIN SELECT
    gender
FROM
    employees
WHERE first_name > 'Tzvetan'
ORDER BY
    first_name,
    last_name

此时,令人惊讶的是,索引生效了。

2 问题分析

此时,我们做一个大胆的猜测:

第一次进行sql分析时,因为第一次order by 后,得到的还是全表数据,如果根据复合索引中携带的主键查找每一个gender进行拼接,自然很费资源和时间,mysql不会做如此蠢的事。不如直接进行全表扫描,把扫描到的每条数据和order by得到的临时数据进行拼接,从而得到需要的数据。

学习资料:Java进阶视频资源

为了验证上述想法的正确性,我们对三次sql进行分析。

第一次sql根据复合索引得到的数据量为:300024,为全表数据

SELECT
    COUNT(first_name)
FROM
    employees
ORDER BY
    first_name,
    last_name

第二次改写的sql根据复合索引得到的数据量为:159149 , 为全表数据量的1/2。

SELECT
    COUNT(first_name)
FROM
    employees
WHERE first_name > 'Leah'
ORDER BY
    first_name,
    last_name

第三次改写的sql根据复合索引得到的数据量为:36731, 为全表数据量的1/10。

SELECT
    COUNT(first_name)
FROM
    employees
WHERE first_name > 'Tzvetan'
ORDER BY
    first_name,
    last_name

通过对比发现,第二次改写的sql根据复合索引得到的数据量是全表数据量的1/2。此时还没有达到mysql使用索引进行二次查找的量级。

第三次改写的sql根据复合索引得到的数据量是全表数据量的1/10,达到了mysql使用索引进行二次查找的量级,于是从执行计划上可以看到,第三次改写sql是走了索引的。

3 总结

mysql 是否根据首次索引条件查询出的主键进行二次查找,也是要看查询出来的数据量级,如果数据量接近全表数据量的话,就会进行全表扫描,否则根据第一次查询出来的主键进行二次查询。

-End-

最近有一些小伙伴,让我帮忙找一些 面试题 资料,于是我翻遍了收藏的 5T 资料后,汇总整理出来,可以说是程序员面试必备!所有资料都整理到网盘了,欢迎下载!

点击👆卡片,关注后回复【面试题】即可获取

在看点这里好文分享给更多人↓↓

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/120489
 
227 次点击