sql优化的一般策略

sql 优化的一般策略:索引优化,sql改写,参数优化,优化器

索引优化

select * from vvshop_order.vv_order where receive_phone='151011324532'; 为例分析

1
explain select * from vv_order where order_no=23;

结果:

202006011431Meh70c52

分析:可以看到该sql扫描全表 30 多万记录,可以通过添加索引优化

1
alter table vv_order add index orderno_idx(order_no);

202006011432J7bRPa14

注意点

  • 当传入的数据类型和库表数据类型不一致时,索引会失效
  • 不要为每个查询字段建立单独的索引,应该根据实际需要建立单列索引或者组合索引
  • 通过explain+extended 检查sql的执行计划,是否使用索引,是否发生隐式转换
  • 避免在查询条件中使用函数

sql 改写

分页优化

原sql select * from buyer where sellerid=100 limit 100000,5000, limit M, N 写法中,M越大,性能越差,可以改写为

1
2
3
select t1.* from buyer t1,
(select id from buyer sellerid=100 limit 1000005000) t2
where t1.id=t2.id;
子查询优化
  1. 查询数量较多时,in改为exist,或者优化为如下的形式

    1
    2
    3
    4
    SELECT first_name
    FROM employees emp,
    (SELECT emp_no FROM salaries_2000 WHERE salary = 5000) sal
    WHERE emp.emp_no = sal.emp_no;
  2. 避免查询返回所有字段,只返回需要的字段数据

不使用 select *
or 改写为 in

or的效率事n,in的效率是log(n),控制in数量在200以内

不使用函数和触发器,通过应用程序实现
少用join,保证字段类型一直再join或比较
连续数值 使用 between

参数优化

优化器

其他

影响in是否生效的因素
  1. eq_range_index_dive_limit 参数

    202006011432iMRPw431

    默认为10

    eq_range_index_dive_limit = 0 只能使用index dive

    0 < eq_range_index_dive_limit <= N 使用index statistics

    eq_range_index_dive_limit > N 只能使用index dive

字段
  1. 根据实际使用情况设置字段类型
  2. 单表不要有太多字段,建议20以内
  3. 避免使用null字段,优化较难且额外占用索引空间
  4. 用整型来存IP

系统参数调优

基准测试工具
  1. sysbench:模块化,跨平台以及多线程的性能测试工具
  2. iibench-mysql:基于java的插入性能测试工具
  3. tpcc-mysql:Percona 开发的TPC-C 测试工具
这里介绍一些比较重要的参数:

back_log

backlog值指出在MySQL暂时停止回答新请求之前的短时间内多少个请求可以被存在堆栈中。也就是说,如果MySql的连接数据达到maxconnections时,新来的请求将会被存在堆栈中,以等待某一连接释放资源,该堆栈的数量即backlog,如果等待连接的数量超过backlog,将不被授予连接资源。可以从默认的50升至500

wait_timeout

数据库连接闲置时间,闲置连接会占用内存资源。可以从默认的8小时减到半小时

maxuserconnection

最大连接数,默认为0无上限,最好设一个合理上限thread_concurrency:并发线程数,设为CPU核数的两倍

skipnameresolve

禁止对外部连接进行DNS解析,消除DNS解析时间,但需要所有远程主机用IP访问

keybuffersize

索引块的缓存大小,增加会提升索引处理速度,对MyISAM表性能影响最大。对于内存4G左右,可设为256M或384M,通过查询show status like’keyread%’,保证keyreads / keyreadrequests在0.1%以下最好

innodbbufferpool_size

缓存数据块和索引块,对InnoDB表性能影响最大。通过查询show status like ‘Innodbbufferpoolread%’,保证 (Innodbbufferpoolreadrequests – Innodbbufferpoolreads)/ Innodbbufferpoolreadrequests 越高越好

innodbadditionalmempoolsize

InnoDB存储引擎用来存放数据字典信息以及一些内部数据结构的内存空间大小,当数据库对象非常多的时候,适当调整该参数的大小以确保所有数据都能存放在内存中提高访问效率,当过小的时候,MySQL会记录Warning信息到数据库的错误日志中,这时就需要该调整这个参数大小

innodblogbuffer_size

InnoDB存储引擎的事务日志所使用的缓冲区,一般来说不建议超过32MB

querycachesize

缓存MySQL中的ResultSet,也就是一条SQL语句执行的结果集,所以仅仅只能针对select语句。当某个表的数据有任何任何变化,都会导致所有引用了该表的select语句在Query Cache中的缓存数据失效。所以,当我们的数据变化非常频繁的情况下,使用Query Cache可能会得不偿失。根据命中率(Qcachehits/(Qcachehits+Qcache_inserts)*100))进行调整,一般不建议太大,256MB可能已经差不多了,大型的配置型静态数据可适当调大.

可以通过命令show status like ‘Qcache_%’查看目前系统Query catch使用大小

readbuffersize

MySql读入缓冲区大小。对表进行顺序扫描的请求将分配一个读入缓冲区,MySql会为它分配一段内存缓冲区。如果对表的顺序扫描请求非常频繁,可以通过增加该变量值以及内存缓冲区大小提高其性能

sortbuffersize

MySql执行排序使用的缓冲大小。如果想要增加ORDER BY的速度,首先看是否可以让MySQL使用索引而不是额外的排序阶段。如果不能,可以尝试增加sortbuffersize变量的大小

readrndbuffer_size

MySql的随机读缓冲区大小。当按任意顺序读取行时(例如,按照排序顺序),将分配一个随机读缓存区。进行排序查询时,MySql会首先扫描一遍该缓冲,以避免磁盘搜索,提高查询速度,如果需要排序大量数据,可适当调高该值。但MySql会为每个客户连接发放该缓冲空间,所以应尽量适当设置该值,以避免内存开销过大。

record_buffer

每个进行一个顺序扫描的线程为其扫描的每张表分配这个大小的一个缓冲区。如果你做很多顺序扫描,可能想要增加该值

threadcachesize

保存当前没有与连接关联但是准备为后面新的连接服务的线程,可以快速响应连接的线程请求而无需创建新的

table_cache

类似于threadcachesize,但用来缓存表文件,对InnoDB效果不大,主要用于MyISAM

References

阿里云慢SQL优化挑战大赛分析

SQL优化器原理 - 查询优化器综述

MYSQL查询SQL语句性能优化方法

MySQL–eq_range_index_dive_limit参数学习

MySQL SQL优化之in与range查询【转】

MySQL5.7利用虚拟列优化