mysql高级性能优化
简历写上:熟练掌握SQL的相关优化及索引的使用,并且能够完成主从集群配置。
为什么SQL需要优化
1、查询性能低
2、执行时间过长(使用LINK的后果)
3、等待时间过长(多线程现象,线程池被占用,请求等待执行)
4、SQL写的太差(尤其体现在多表查询上)
5、索引失败
6、服务器参数(缓存、线程数)设置不合理
7、项目需求不合理
8、等。。。
4、5是程序员能优化的,其他的和DBA相关
程序员写代码时能够做的只有对写SQL尽可能的做出优化,执行效率更高,有效的使用索引,重点放在写SQL上
SQL的执行过程
参考资料:https://www.cnblogs.com/annsshadow/p/5037667.html
简化
- 接收传入的SQL
- 查看该SQL对应的结果在缓存中是否存在
- 由解析器来解析当前SQL,最终形成初步的解析树
- 再由预处理器对解析树进行调整,完成占位符赋值等操作
- 查询优化器对最终的解析树进行优化,包括调整SQL顺序等
- 根据优化后的结果得出查询语句的执行计划,就是查询数据的具体实施方案,交给查询的执行引擎
- 查询执行引擎调用存储引擎提供的API,最后由存储引擎来完成数据的查询,然后返回结果
SQL的执行顺序
写SQL的顺序
select > from > join > on > where > group by > having > order by > limit
解析SQL时的顺序
from > on > join > where > group by > having > select > order by > limit
注意先先on 后join
数据库索引
MySql中索引使用的B+数(B+tree)【查询3次,支持百万数据】
索引的利
- 减少IO操作次数,提高查询效率
- 降低CPU使用率(在排序操作中尤为明显)
索引的弊
- 占用大量的磁盘存储空间
- 不适用索引的情况
- 数据量小的表
- 频繁变动的字段
- 不经常查询的字段
- 降低DML操作效率
索引分类
主键索引
单列索引
唯一索引
复合索引(项目中使用最多,做查询时只能选择一个索引来使用,比较有优势,但使用限制比较多)
多个列的值组成的索引,当第一个列的值重复时,按照后面的的组合继续查找数据
相当于字典的二级目录,当前一个值一致时,再使用后一个值做筛选
查看SQL执行计划
explain执行计划包含的信息
其中最重要的字段为:id、type、key、rows、Extra
各字段详解
id:select查询的***,包含一组数字,表示查询中执行select子句或操作表的顺序
三种情况:
1、id相同:执行顺序由上至下
2、id不同:如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
3、id相同又不同(两种情况同时存在):id如果相同,可以认为是一组,从上往下顺序执行;在所有组中,id值越大,优先级越高,越先执行
select_type:查询的类型,主要是用于区分普通查询、联合查询、子查询等复杂的查询
- SIMPLE:简单的select查询,查询中不包含子查询或者union
- PRIMARY:查询中包含任何复杂的子部分,最外层查询则被标记为primary
- SUBQUERY:在select 或 where列表中包含了子查询
- DERIVED:在from列表中包含的子查询被标记为derived(衍生),mysql或递归执行这些子查询,把结果放在零时表里
- UNION:若第二个select出现在union之后,则被标记为union;若union包含在from子句的子查询中,外层select将被标记为derived
- UNION RESULT:从union表获取结果的select
type:访问类型,sql查询优化中一个很重要的指标,结果值从好到坏依次是:
system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
一般来说,好的sql查询至少达到range级别,最好能达到ref
- system:表只有一行记录(等于系统表),这是const类型的特例,平时不会出现,可以忽略不计
- const:表示通过索引一次就找到了,const用于比较primary key 或者 unique索引。因为只需匹配一行数据,所有很快。如果将主键置于where列表中,mysql就能将该查询转换为一个const
- eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键 或 唯一索引扫描。注意:ALL全表扫描的表记录最少的表
- ref:非唯一性索引扫描,返回匹配某个单独值的所有行。本质是也是一种索引访问,它返回所有匹配某个单独值的行,然而他可能会找到多个符合条件的行,所以它应该属于查找和扫描的混合体
- range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了那个索引。一般就是在where语句中出现了bettween、<、>、in等的查询。这种索引列上的范围扫描比全索引扫描要好。只需要开始于某个点,结束于另一个点,不用扫描全部索引
- index:Full Index Scan,index与ALL区别为index类型只遍历索引树。这通常为ALL块,应为索引文件通常比数据文件小。(Index与ALL虽然都是读全表,但index是从索引中读取,而ALL是从硬盘读取)
- ALL:Full Table Scan,遍历全表以找到匹配的行
possible_keys:查询涉及到的字段上存在索引,则该索引将被列出,但不一定被查询实际使用
key:实际使用的索引,如果为NULL,则没有使用索引。查询中如果使用了覆盖索引,则该索引仅出现在key列表中
key_le:表示索引中使用的字节数,查询中使用的索引的长度(最大可能长度),并非实际使用长度,理论上长度越短越好。key_len是根据表定义计算而得的,不是通过表内检索出的
ref:显示索引的那一列被使用了,如果可能,是一个常量const。
rows:根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数
Extra:不适合在其他字段中显示,但是十分重要的额外信息
https://blog.csdn.net/wuseyukui/article/details/71512793
1、Using filesort :mysql对数据使用一个外部的索引排序,而不是按照表内的索引进行排序读取。也就是说mysql无法利用索引完成的排序操作成为“文件排序”
由于索引是先按email排序、再按address排序,所以查询时如果直接按address排序,索引就不能满足要求了,mysql内部必须再实现一次“文件排序”
2、Using temporary:
使用临时表保存中间结果,也就是说mysql在对查询结果排序时使用了临时表,常见于order by 和 group by
3、Using index:
表示相应的select操作中使用了覆盖索引(Covering Index),避免了访问表的数据行,效率高
如果同时出现Using where,表明索引被用来执行索引键值的查找(参考上图)
如果没用同时出现Using where,表明索引用来读取数据而非执行查找动作
覆盖索引(Covering Index):也叫索引覆盖。就是select列表中的字段,只用从索引中就能获取,不必根据索引再次读取数据文件,换句话说查询列要被所建的索引覆盖。
注意:
a、如需使用覆盖索引,select列表中的字段只取出需要的列,不要使用select *
b、如果将所有字段都建索引会导致索引文件过大,反而降低crud性能
4、Using where :
使用了where过滤
5、Using join buffer :
使用了链接缓存
6、Impossible WHERE:
where子句的值总是false,不能用来获取任何元祖
7、select tables optimized away:
在没有group by子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段在进行计算,查询执行计划生成的阶段即可完成优化
8、distinct:
优化distinct操作,在找到第一个匹配的元祖后即停止找同样值得动作
适当使用索引
建立索引的原则
- 较频繁的作为查询条件的字段应该创建索引
- 唯一性太差的字段不适合单独创建索引,即使频繁作为查询条件。作为索引的列,如果不能有效的区分数据,那么这个列就不适合作为索引(比如:性别,状态不多的状态列)
- 更新非常频繁的字段不适合创建索引,原因:索引有维护成本
- 不会出现在where子句中的字段不该创建索引
- 索引不是越多越好(只为必要的列创建索引)
join的原则:不要使用隐式连接,原因在于SQL的执行顺序
- 数据量小的表卸载join的左边,数据量大的表卸载join的右边
MySQL中join都是通过Netsted Loop join来实现,简单理解为循环嵌套,应该数据量少的表作为外层循环,数据量大的表作为内层循环,然后合并结果
- 优先优化Netsted Loop的内层循环
- 保证join语句中被作为连接条件的字段已经建立了索引
- 扩大缓冲器的大小,容纳更大的查询数据
避免索引失效(忽略查询优化器)
- where语句中索引列参与算术计算,该索引失效
- where语句中索引列参与函数运算,该索引失效
- where语句中使用in云闪付有事会让索引失效
- where语句中做不等于运算,该索引失效
- where语句中发生类型转发,该索引失效
- where语句中模糊查询时以%开头,该索引失效
- 在复合索引的使用时跟声明书顺序不一致或者中间有列的缺失,该索引失效
优化不合理需求
考虑是否有必要真实
遇到不合理的需求,考虑其他方式
哪些需求是不合理的:对系统使用没有影响,浪费系统大量资源定义为不合理需求