社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  DATABASE

面试官:使用 MySQL 时你遇到过哪些索引失效的场景?

脚本之家 • 6 天前 • 28 次点击  
脚本之家 设为“星标
第一时间收到文章更新
图片
来源 | 君哥聊技术(ID:gh_1f109b82d301) 

面试官:使用 MySQL 时你遇到过哪些索引失效的场景?

我:MySQL 索引失效的场景有很多,我说一下我遇到的几个场景。 先假定有一张员工表,sql 如下:

CREATE TABLE`tb_staff` (
`staff_id`tinyint(3NOTNULLCOMMENT'员工编号',
`id_no`varchar(20DEFAULTNULL COMMENT'员工姓名',
`name`varchar(20DEFAULTNULLCOMMENT'员工姓名',
`email`varchar(200DEFAULTNULLCOMMENT'邮件地址',
`age`tinyint(3DEFAULTNULLCOMMENT'年龄',
`sex`tinyint(1DEFAULT'0'COMMENT'性别,0:男 1:女',
`address`varchar(300DEFAULTNULLCOMMENT'家庭住址',
`create_time`timestampNOTNULLDEFAULTCURRENT_TIMESTAMPONUPDATECURRENT_TIMESTAMPCOMMENT'创建时间',
`update_time`timestampNOTNULLDEFAULTCURRENT_TIMESTAMPCOMMENT'更新时间',
  PRIMARY KEY (`staff_id`),
KEY`id_no` (`id_no`),
KEY`union_idno_name_email` (`id_no`,`name`,`email`)
ENGINE=InnoDBDEFAULTCHARSET=utf8

1. 使用 like 语句做模糊查询时,占位符 % 放在了最左边。比如我们查找 id_no 以 8933 结尾的员工:

select * from tb_staff where id_no like '%8933';

虽然 id_no 字段加了索引,但上面的 SQL 因为占位符在最左边,也不能走索引。

2. 使用 not like 语句,不能走索引。下面的 sql 使用 id_no 作为条件 ,不能走索引:




    
SELECT * FROM db_staff WHERE id_no NOT LIKE  '120%';

3. 使用 not in 语句时,也不能走索引。举个例子 :

select * from tb_staff where id_no not in ('xxxx','yyyy');

4. 使用 not exists 语句时,也不能走索引。举个例子 :再建一张专门保存 staff_id 的表 db_staff_id

SELECT * FROM db_staff f WHERE NOT EXISTS (SELECT staff_id FROM db_staff_id a WHERE a.staff_id = f.staff_id);

面试官:not in 语句一定不能走索引吗?

我:不一定。如果 not in 后面跟的是主键,有可能会走索引。比如 not in 排除的值比较少,这种情况是会走索引的。

面试官:你还遇到过其他索引失效的场景吗?

我:还有几个场景,我再说一下: 

5. 在条件语句中使用函数、表达式或隐式转换,比如下面的 sql:

--使用表达式 
EXPLAIN SELECT * FROM db_staff WHERE staff_id + 1 = 2;
--使用隐式转换,数值类型转VARCHAR
EXPLAIN SELECT * FROM db_staff WHERE id_no = 110112202409881123;

6. 使用不等于,!=,<> 时也不会走索引。

面试官:使用“不等于”条件时一定不能走索引吗?

我:不一定,如果条件时主键时,也是可以走索引的。

面试官:还有其他索引失效的场景吗?

我:我想想。。

 7. IS NOT NULL 语句也不能走索引,比如:

SELECT * FROM db_staff WHERE id_no IS NOT NULL;

8. 使用 or 语句也不能走索引,比如:

SELECT * FROM db_staff WHERE staff_id = 2 OR id_no ='4';

但如果 or 语句涉及的条件都是主键,也是可以走索引的:

SELECT * FROM db_staff WHERE staff_id = 2 OR staff_id =3;

面试官:or 语句有优化方法吗?

我:可以使用 union 语句来替代,比如:

SELECT * FROM db_staff WHERE staff_id = 2 UNION SELECT * FROM db_staff WHERE id_no = '110112202409881123'

如果查询的字段比较少,可以走覆盖索引,前面建表语句对 id_no、name、email 三个字段 加了覆盖索引,比如下面 sql:




    
SELECT id_no,NAME,email FROM db_staff WHERE id_no = '110112202409881123' OR NAME='zhangsan'

面试官:还有其他索引失效的场景吗?

我:还有下面一个场景: 

9. 如果查询的数据集比较大,占整个表数据量比例较大时,MySQL 可能会认为走全表扫描代价更小,所以选择走全表扫描。这时候可以增加条件过滤减小结果集,或者强制使用索引。

SELECT * FROM db_staff FORCE INDEX(union_idno_name_email)

面试官:order by 语句有可能会让查询走不上索引吗?

我:有可能。

10. order by 中的字段跟 where 条件中字段不一致时,也可能会导致索引失效。比如下面的 SQL:

SELECT id_no,NAME,email FROM db_staff WHERE id_no > '110112202409881120' ORDER BY create_time;

而且,group by 也有这个问题。但如果覆盖索引可以包含 where 条件和 order by 中的字段,则可以走覆盖索引。

SELECT id_no,NAME,email FROM db_staff WHERE id_no > '110112202409881120' ORDER BY email;

面试官:还有其他吗?

我:我知道的就这些了,当然也跟数据库的版本有一些关系。sql 是否走索引,决定因素很多,比如查询语句、结果集等。我们写 sql 语句时,如果表数据量比较大,最好用执行计划 EXPLAIN 分析一下 sql 是否正确地走索引了。

面试官:执行计划有哪些属性呢,可以说一下吗?

我: 我了解的属性如下:

  • type: 访问类型,即索引的使用方式,查询效率从高到底依次是:system > const > eq_ref > ref > range > index > ALL;
  • key: 实际使用的索引,如果为NULL则表示未使用索引;
  • key_len:索引字段的长度,使用联合索引时这个字段可以看到使用了联合索引的哪些字段;
  • rows: 预计扫描行数,这个属性值越小执行效率越高;
  • Extra: 额外信息,比如 Using where、Using filesort、Using index 。

面试官:上面 type 属性中的 eq_ref 和 ref 能讲一下吗?

我:好的

  • eq_ref 是指每行数据都是通过主键或唯一索引与另一张表做 join,每次 join 只会匹配到一行数据。比如下面 sql:
SELECT f.staff_id FROM db_staff f LEFT JOIN db_staff a ON a.staff_id = f.staff_id
  • ref 是指使用普通索引(不包括唯一索引)进行查找,查询条件可能匹配索引中的多个行。比如下面 sql:
SELECT id_no,NAME,email FROM db_staff WHERE id_no = '110112202409881120';

面试官:恭喜你,通过了。

图片
  推荐阅读:
  1. 如何优化一条SQL语句的性能?
  2. 放假回微信算不算加班?法院判了
  3. mmap是如何巧妙绕过传统IO性能陷阱的?
  4. 阿里二面:聊聊 MySQL 主从同步方案的优缺点
  5. MySQL同步ES的6种方案!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/182746
 
28 次点击