Py学习  »  DATABASE

MySQL SQL 优化指南 SQL 四句真言(优化系列 3)

AustinDatabases • 4 天前 • 28 次点击  

开头还是介绍一下群,如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, OceanBase, Sql Server等有问题,有需求都可以加群群内有各大数据库行业大咖,可以解决你的问题。加群请联系 liuaustin3 ,(共3300人左右 1 + 2 + 3 + 4 +5 + 6 + 7 + 8 +9)(1 2 3 4 5 6 7群均已爆满,开8群近400 9群 200+,开10群PolarDB专业学习群100+)

上期说完MSSQL的优化后,相信科技的力量让SQL优化更加简单深入人心,但如果你用的是MySQL,瞬间一种天堂到地狱的赶脚。咱们今天就说说磨练人心性的MySQL SQL优化。

咱们也有四句真言,给MySQL SQL优化

参数调整挺重要,查询方式很重要,

 大表你的要会拆,架构优化少不了, 

善用SQL的改写,避免中间大结果, 

尽量升级8.0 ,更好引擎效率高。

熟悉MySQL的同学对于SQL优化中第一个问题并不是SQL本身的这个问题应该很清楚,早期玩MySQL的都是现在参数的调整里面先玩一顿,然后在转向表的拆分,最后才是SQL本身。

第一个参数与你的CPU有关,innodb_buffer_pool_instances,提高并发度使用内存的灵活性,有效的将buffer pool分片,在高并发写的情况下,减少latch的竞争。CPU 核心越多,内存越大,这个部分分的就越多,具体优化这个参数的文档很多,可以去读一读。

剩下的就是 join_buffer_size, read_buffer_size,read_rnd_buffer_size,这些都是主导读取数据时的线程的缓存大小,对于order by  group by 顺序扫描以及大表的join等都有提升效率的功能。具体与每个数据库承载的业务和撰写的SQL复杂度和调取数据量有关。

同时对于optimizer_switch , 里面那一堆的参数也要有所取舍,尤其对于group by 语法的参数在5.X 升级到8的兼容性要进行测试,否则升级版本在这块可能会失败,导致升级回退,sort_buffer_size, tmp_table_size等在需要排序和临时表的时候,也要设置对应的内存帮助加速查询。

在MySQL优化中,更多的是拆表,且集中在逻辑业务拆分,而不是使用MySQL的分区表,到现在我还是这个观点,MySQL不要用分区表,原因之前的文章有写过。

同时老的MySQL的DBA 还会思考主键的问题,主键越小越好 ,这与MySQL的原理息息相关,更小的主键会让数据更多在Btree的上层,而不是下层,分表的原因也是这个,所以那时我们会纠结主键大小的问题。

关于改写SQL的问题,在MySQL是家常便饭,尤其是一些军规和什么SQL撰写的要求。列两条让传统的MySQL DBA回忆一下。 

避免 SELECT *,SELECT * 会取所有列,可能让中间结果变大。改写成只取需要的列:SELECT id, name FROM users。

EXISTS 优于 IN(大子查询时)

IN (SELECT …) 在结果集很大时会生成临时表。改写:EXISTS (SELECT 1 FROM … WHERE condition)。

JOIN 代替子查询

有时子查询会产生巨大的中间结果。改写成 JOIN 并配合索引,减少中间表

避免大范围 OR,用 UNION ALL

WHERE col = 'a' OR col = 'b' 可能导致索引失效。

比如下面的SQL

SELECT u.user_id, u.user_name
FROM users u
WHERE u.user_id IN (
    SELECT o.user_id
    FROM orders o
    WHERE o.order_date >= '2024-01-01'
    GROUP BY o.user_id
    HAVING SUM(o.amount) > 1000
);

可以改写成

SELECT u.user_id, u.user_name
FROM users u
JOIN (
    SELECT o.user_id
    FROM orders o
    WHERE o.order_date >= '2024-01-01'
    GROUP BY o.user_id
    HAVING SUM(o.amount) > 1000
) t ON u.user_id = t.user_id;

还可以改写成

SELECT u.user_id, u.user_name
FROM users u
WHERE EXISTS (
    SELECT 1
    FROM orders o
    WHERE o.user_id = u.user_id
      AND o.order_date >= '2024-01-01'
    GROUP BY o.user_id
    HAVING SUM(o.amount) > 1000
);

留一个小问题,这两个方案有什么不同,第二个方案适合什么场景??

最后一句,建议升级到8.0版本的原因,我简单说几个

1  Hash join

2  倒序索引

3  窗口函数提供

4  CTE通用表达式的提供

5  虚拟列和JOIN 的执行计划的完善

6  使用更好的直方图统计方式

这里举几个简单的例子

1 Hash Join

EXPLAIN FORMAT=tree
SELECT o.order_id, c.customer_name
FROM orders o
JOIN customers c ON o.customer_id = c.customer_id;

在8.018这个版本后,支持Hash join,当有两个大表JOIN的时候,可以使用hash join,而不是nested loop 的方式

2 倒序排序 早先MYSQL不支持倒序索引,全部都是正序,倒序SQL执行效率低

CREATE INDEX idx_order_date_desc ON orders(order_date DESC);

EXPLAIN SELECT * FROM orders ORDER BY order_date DESC LIMIT 10;

3  窗口函数的提供

在MYSQL8提供了一些先进的函数,比如下面的SQL,你看看

SELECT customer_id, order_date,
       @rn := IF(@prev_customer = customer_id, @rn + 1, 1) AS rn,
       @prev_customer := customer_id
FROM (
    SELECT customer_id, order_date
    FROM orders
    ORDER BY customer_id, order_date
) t,
(SELECT @rn := 0, @prev_customer := NULL) vars;

如果到了MYSQL8 可以写成

SELECT customer_id, order_date,
       ROW_NUMBER() OVER(PARTITION BY customer_id ORDER BY order_date) AS rn
FROM orders;

当然最后还有我们熟悉的虚拟列,这个部分文章较多就不赘述了。

在早先的MySQL DBA值钱的原因之一,是要动一些架构的知识,也就是会逻辑业务分库,在懂得业务,配合架构知识,对于整体数据的一个拆分,这是早先 MSSQL ,ORACLE DBA 不具备的知识,所以 MySQL DBA本身值钱的部分是对于整体知识的把控,而到了现在这些被架构师拿走了,MySQL DBA的辉煌也随着MySQL本身的迭代和本身的数据处理能力的增强,成为了过去式。

这里举一个例子 ,

比如电商网站中的

  • 用户表users(千万级用户)

  • 商品表products(百万级商品)

  • 订单表orders(每天千万级写入)

  • 支付表payments(高频更新)


MySQL无法承受,数据量大后的单库承载数据量级,造成数据处理的困难和备份等等问题。
  • 单库单实例:所有表都放在一台 MySQL 里,查询和写入争抢 I/O。

  • 业务无区分:用户、商品、订单、支付混在一起,业务部门谁动谁的表都不清晰。

  • 高并发写入瓶颈:尤其是订单表,单表写入超过千万行后,insert/update/索引维护非常慢。

  • 备份与运维困难:mysqldump 或全库备份,动辄几个小时。


在了解业务后,DBA 应给出拆分的思路

  • 用户数据(读多写少)

  • 商品数据(读多写少,缓存可用)

  • 订单 & 支付(写多 + 热点操作)


然后对于这些信息进行分析,看数据拆分的路径是什么,按业务拆分
  • user_db → 用户库

  • product_db → 商品库

  • order_db → 订单库

  • payment_db → 支付库

然后再针对业务逻辑拆分后的表进行二次分库分表的拆分

按 用户 ID 取模 

  • order_db_00 ~ order_db_15 (16 个库,按 user_id % 16 拆分)


这样分库分表后,整体的单表会被分到不同的实例,即使在同一个实例,也可能不在一个逻辑库,即使在一个逻辑库,也会在不同的逻辑表。


结果显而易见
  • 单表压力从 亿级 → 千万级,性能明显提升。

  • 高频写入的订单库 吞吐量翻倍,单机 QPS 从几千提升到几万。

  • 备份/恢复只针对单库,时间缩短 数小时 → 数分钟

  • 业务部门之间的表操作更清晰,架构层次分明。


所以早期的MySQL的优化心思不是 SQL的优化,是架构的优化,分库分表。

总体MYSQL的优化是一个立体化,架构化,形式不固定化的方案结合体,相对其他的数据库,可能“歪门邪道”会多一些,但怎么优化的目的都是一样,快速的解决业务的需求。


置顶
沧海要,《SQL SERVER 运维之道》,清风笑,竟惹寂寥
SQL SERVER SQL 优化指南  四句真言 (SQL 优化系列 2)
PostgreSQL SQL 优化指南 四句真言(SQL 优化系列 1)
从 Universal 环球影城 到 国产数据库产品 营销 --驴唇对马嘴
3种方式 PG大版本升级  接锅,背锅,不甩锅  以客户为中心做产品
"PostgreSQL" 不重启机器就能调整 shared buffer pool  的原理
超强外挂让MySQL再次兴盛,国内神秘组织拯救MySQL行动
AI 很聪明,但就怕脑子失忆,记忆对AI很重要
从某数据库信任“危机”,简谈危机公关
邦邦硬的PostgreSQL技术干货来了,怎么动态扩展PG内存 !
数据库信创话题能碰吗? 今天斗胆说说
企业出海数据库设计问题一角,与政策动荡下的全球数据库产品
计问题一角,与政策动荡下的全球数据库产品

《数据库江湖邪修门派:心法五式全解》

微软动手了,联合OpenAI + Azure 云争夺AI服务市场

“当复杂的SQL不再需要特别的优化”,邪修研究PolarDB for PG 列式索引加速复杂SQL运行

企业出海“DB”要合规,要不挣那点钱都不够赔的

“合体吧兄弟们!”——从浪浪山小妖怪看OceanBase国产芯片优化《OceanBase “重如尘埃”之歌》

未知黑客通过SQL SERVER 窃取企业SAP核心数据,影响企业运营

那个MySQL大事务比你稳定,主从延迟低,为什么? Look my eyes! 因为宋利兵宋老师

非“厂商广告”的PolarDB课程:用户共创的新式学习范本--7位同学获奖PolarDB学习之星

       说我PG Freezing Boom 讲的一般的那个同学,专帖给你,看看这次可满意

     短评 国产数据库营销市场 “问题”

     这个 PostgreSQL 让我有资本找老板要 鸡腿 鸭腿 !!

     DBA被瞧不起 你有什么建议? Drive Fast !

OceanBase Hybrid search 能力测试,平换MySQL的好选择

HyBrid Search 实现价值落地,从真实企业的需求角度分析 !不只谈技术!

一个IP地址访问两个PG实例,上演“一女嫁二夫”的戏码

OceanBase 光速快递 OB Cloud “MySQL” 给我,Thanks a lot

从“小偷”开始,不会从“强盗”结束 -- IvorySQL 2025 PostgreSQL 生态大会

被骂后的文字--技术人不脱离思维困局,终局是个 “死” ? ! ......

个群2025上半年总结,OB、PolarDB, DBdoctor、爱可生、pigsty、osyun、工作岗位等

卷呀卷,Hybrid 混合查询学习--哪个库是小趴菜

从MySQL不行了,到乙方DBA 给狗,狗都不干? 我干呀!

DBA 干不好容易蹲牢房--这事你知道吗?

SQL SERVER 2025发布了, China幸亏有信创!

MongoDB 麻烦专业点,不懂可以问,别这么用行吗 ! --TTL

P-MySQL SQL优化案例,反观MySQL不死没有天理

MySQL 条件下推与排序优化实例--MySQL8.035

云数据库厂商除了卷技术,下一个阶段还可以卷什么?

PostgreSQL 新版本就一定好--由培训现象让我做的实验

某数据库下的一手好棋!共享存储落子了!

删除数据“八扇屏” 之 锦门英豪  --我去-BigData!

PostgreSQL “乱弹” 从索引性能到开发优化

写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》

SQLSHIFT 是爱可生对OB的雪中送炭!

青春的记忆,MySQL 30年感谢有你,再见!(译)

老实人做的数据库产品,好像也不“老实” !

疯狂老DBA 和 年轻“网红” 程序员 --火星撞地球-- 谁也不是怂货  

哈呀站,OB广州开发者大会 之 “五” 眼联盟

和架构师沟通那种“一坨”的系统,推荐只能是OceanBase,Why ?


OceanBase 相关文章

某数据库下的一手好棋!共享存储落子了!

写了3750万字的我,在2000字的OB白皮书上了一课--记 《OceanBase 社区版在泛互场景的应用案例研究》

     哈呀站,OB广州开发者大会 之 “五” 眼联盟
OceanBase 单机版可以大批量快速部署吗? YES
OceanBase 6大学习法--OBCA视频学习总结第六章
OceanBase 6大学习法--OBCA视频学习总结第五章--索引与表设计
OceanBase 6大学习法--OBCA视频学习总结第五章--开发与库表设计
OceanBase 6大学习法--OBCA视频学习总结第四章 --数据库安装
OceanBase 6大学习法--OBCA视频学习总结第三章--数据库引擎
OceanBase 架构学习--OB上手视频学习总结第二章 (OBCA)
OceanBase 6大学习法--OB上手视频学习总结第一章
没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛
OceanBase  送祝福活动,礼物和幸运带给您

跟我学OceanBase4.0 --阅读白皮书 (OB分布式优化哪里了提高了速度)

跟我学OceanBase4.0 --阅读白皮书 (4.0优化的核心点是什么)

跟我学OceanBase4.0 --阅读白皮书 (0.5-4.0的架构与之前架构特点)

跟我学OceanBase4.0 --阅读白皮书 (旧的概念害死人呀,更新知识和理念)

聚焦SaaS类企业数据库选型(技术、成本、合规、地缘政治)

OceanBase 学习记录-- 建立MySQL租户,像用MySQL一样使用OB
         MongoDB 相关文章

MongoDB “升级项目” 大型连续剧(4)-- 与开发和架构沟通与扫尾

MongoDB “升级项目” 大型连续剧(3)-- 自动校对代码与注意事项

MongoDB “升级项目” 大型连续剧(2)-- 到底谁是"der"

MongoDB “升级项目”  大型连续剧(1)-- 可“生”可不升

MongoDB  大俗大雅,上来问分片真三俗 -- 4 分什么分

MongoDB 大俗大雅,高端知识讲“庸俗” --3 奇葩数据更新方法

MongoDB 学习建模与设计思路--统计数据更新案例

MongoDB  大俗大雅,高端的知识讲“通俗” -- 2 嵌套和引用

MongoDB  大俗大雅,高端的知识讲“低俗” -- 1 什么叫多模

MongoDB 合作考试报销活动 贴附属,MongoDB基础知识速通

MongoDB 年底活动,免费考试名额 7个公众号获得

MongoDB 使用网上妙招,直接DOWN机---清理表碎片导致的灾祸 (送书活动结束)

MongoDB 2023年度纽约 MongoDB 年度大会话题 -- MongoDB 数据模式与建模

MongoDB  双机热备那篇文章是  “毒”
MongoDB   会丢数据吗?在次补刀MongoDB  双机热备
MONGODB  ---- Austindatabases  历年文章合集

PolarDB 已经开放的课程
PolarDB 非官方课程第八节--数据库弹性弹出一片未来--结课
PolarDB 非官方课程第七节--数据备份还原瞬间完成是怎么做到的--答题领奖品
PolarDB 非官方课程第六节--数据库归档还能这么玩--答题领奖品
PolarDB 非官方课程第五节--PolarDB代理很重要吗?--答题领奖品
PolarDB 非官方课程第四节--PG实时物化视图与行列数据整合处理--答题领奖品
PolarDB 非官方课程第三节--MySQL+IMCI=性能怪兽--答题领奖品
PolarDB 非官方课程第二节--云原生架构与特有功能---答题领奖品
PolarDB 非官方课程第一节-- 用户角度怎么看PolarDB --答题领奖品

免费PolarDB云原生课程,听课“争”礼品,重塑云上知识,提高专业能力


PolarDB 相关文章
数据压缩60%让“PostgreSQL” SQL运行更快,这不科学呀?
这个 PostgreSQL 让我有资本找老板要 鸡腿 鸭腿 !!
用MySQL 分区表脑子有水!从实例,业务,开发角度分析 PolarDB 使用不会像MySQL那么Low
P-MySQL SQL优化案例,反观MySQL不死没有天理
MySQL 和 PostgreSQL 可以一起快速发展,提供更多的功能?
这个MySQL说“云上自建的MySQL”都是”小垃圾“
        PolarDB MySQL 加索引卡主的整体解决方案

“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!

PostgreSQL 的搅局者问世了,杀过来了!

在被厂商围剿的DBA 求生之路 --我是老油条

POLARDB  添加字段 “卡” 住---这锅Polar不背

PolarDB 版本差异分析--外人不知道的秘密(谁是绵羊,谁是怪兽)

在被厂商围剿的DBA 求生之路 --我是老油条

PolarDB 答题拿-- 飞刀总的书、同款卫衣、T恤,来自杭州的Package(活动结束了)

PolarDB for MySQL 三大核心之一POLARFS 今天扒开它--- 嘛是火


PostgreSQL 相关文章
说我PG Freezing Boom 讲的一般的那个同学专帖给你看这次可满意
一个IP地址访问两个PG实例,上演“一女嫁二夫”的戏码
PostgreSQL  Hybrid能力岂非“小趴菜”数据库可比 ?
PostgreSQL 新版本就一定好--由培训现象让我做的实验
PostgreSQL “乱弹” 从索引性能到开发优化

PostgreSQL  无服务 Neon and Aurora 新技术下的新经济模式 (翻译)

PostgreSQL的"犄角旮旯"的参数捋一捋

PostgreSQL逻辑复制槽功能

PostgreSQL 扫盲贴 常用的监控分析脚本

“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!

PostgreSQL  添加索引导致崩溃,参数调整需谨慎--文档未必完全覆盖场景
PostgreSQL 的搅局者问世了,杀过来了!
PostgreSQL SQL优化用兵法,优化后提高 140倍速度
PostgreSQL 运维的难与“难”  --上海PG大会主题记录
PostgreSQL 什么都能存,什么都能塞 --- 你能成熟一点吗?
PostgreSQL 迁移用户很简单 ---  我看你的好戏

PostgreSQL 用户胡作非为只能受着 --- 警告他

全世界都在“搞” PostgreSQL ,从Oracle 得到一个“馊主意”开始
PostgreSQL 加索引系统OOM 怨我了--- 不怨你怨谁

PostgreSQL “我怎么就连个数据库都不会建?” --- 你还真不会!

病毒攻击PostgreSQL暴力破解系统,防范加固系统方案(内附分析日志脚本)
PostgreSQL 远程管理越来越简单,6个自动化脚本开胃菜

PostgreSQL 稳定性平台 PG中文社区大会--杭州来去匆匆

PostgreSQL 如何通过工具来分析PG 内存泄露

PostgreSQL  分组查询可以不进行全表扫描吗?速度提高上千倍?

POSTGRESQL --Austindatabaes 历年文章整理

PostgreSQL  查询语句开发写不好是必然,不是PG的锅

PostgreSQL  字符集乌龙导致数据查询排序的问题,与 MySQL 稳定 "PG不稳定"
PostgreSQL  Patroni 3.0 新功能规划 2023年 纽约PG 大会 (音译)
PostgreSQL   玩PG我们是认真的,vacuum 稳定性平台我们有了
PostgreSQL DBA硬扛 垃圾 “开发”,“架构师”,滥用PG 你们滚出 !(附送定期清理连接脚本)

DBA 失职导致 PostgreSQL 日志疯涨


MySQL相关文章

MySQL 条件下推与排序优化实例--MySQL8.035

青春的记忆,MySQL 30年感谢有你,再见!(译)

MySQL 8 SQL 优化两则 ---常见问题

MySQL SQL优化快速定位案例 与 优化思维导图
"DBA 是个der" 吵出MySQL主键问题多种解决方案
MySQL 怎么让自己更高级---从内存表说到了开发方式
MySQL timeout 参数可以让事务不完全回滚
MySQL 让你还用5.7 出事了吧,用着用着5.7崩了
MySQL 的SQL引擎很差吗?由一个同学提出问题引出的实验
用MySql不是MySQL, 不用MySQL都是MySQL 横批 哼哼哈哈啊啊
MYSQL  --Austindatabases 历年文章合集


临时工访谈系列

没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛

ETL 行业也够卷,云化ETL,ETL 软件不过了


SQL SERVER 系列
SQL SERVER维保AI化,从一段小故事开始
SQL SERVER 如何实现UNDO REDO 和PostgreSQL 有近亲关系吗
SQL SERVER 危险中,标题不让发,进入看详情(译)






Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/186334
 
28 次点击