MySQL调优之SQL语句优化

2,909 阅读

优化原因

  • SQL语句是对数据库进行操作的唯一路径
  • SQL语句消耗了70-90%的数据库资源
  • SQL语句的优化在时间成本和风险上的代价都很低
  • SQL语句有不同的写法

优化案例

1、不使用子查询 例:SELECT * FROM t1 WHERE id (SELECT id FROM t2 WHERE name='hechunyang'); 子查询在MySQL5.5版本里,内部执行计划器是这样执行的:先查外表再匹配内表,而不是先查内表t2,当外表的数据很大时,查询速度会非常慢。 在MariaDB10/MySQL5.6版本里,采用join关联方式对其进行了优化,这条SQL会自动转换为 SELECT t1.* FROM t1 JOIN t2 ON t1.id = t2.id; 但请注意的是:优化只针对SELECT有效,对UPDATE/DELETE子查询无效,固生产环境应避免使用子查询

2、避免函数索引 例:SELECT * FROM t WHERE YEAR(d) >= 2016; 由于MySQL不像Oracle那样支持函数索引,即使d字段有索引,也会直接全表扫描。 应改为-----> SELECT * FROM t WHERE d >= '2016-01-01';

3、用IN来替换OR 低效查询 SELECT * FROM t WHERE LOC_ID = 10 OR LOC_ID = 20 OR LOC_ID = 30; -----> 高效查询 SELECT * FROM t WHERE LOC_IN IN (10,20,30);

4、LIKE双百分号无法使用到索引 SELECT * FROM t WHERE name LIKE '%de%'; -----> SELECT * FROM t WHERE name LIKE 'de%'; 目前只有MySQL5.7支持全文索引(支持中文)

5、读取适当的记录LIMIT M,N SELECT * FROM t WHERE 1; -----> SELECT * FROM t WHERE 1 LIMIT 10;

6、避免数据类型不一致 SELECT * FROM t WHERE id = '19'; -----> SELECT * FROM t WHERE id = 19;

7、分组统计可以禁止排序 SELECT goods_id,count() FROM t GROUP BY goods_id; 默认情况下,MySQL对所有GROUP BY col1,col2...的字段进行排序。如果查询包括GROUP BY,想要避免排序结果的消耗,则可以指定ORDER BY NULL禁止排序。 -----> SELECT goods_id,count() FROM t GROUP BY goods_id ORDER BY NULL;

8、避免随机取记录 SELECT * FROM t1 WHERE 1=1 ORDER BY RAND() LIMIT 4; MySQL不支持函数索引,会导致全表扫描 -----> SELECT * FROM t1 WHERE id >= CEIL(RAND()*1000) LIMIT 4;

9、禁止不必要的ORDER BY排序 SELECT count(1) FROM user u LEFT JOIN user_info i ON u.id = i.user_id WHERE 1 = 1 ORDER BY u.create_time DESC; -----> SELECT count(1) FROM user u LEFT JOIN user_info i ON u.id = i.user_id;

10、批量INSERT插入 INSERT INTO t (id, name) VALUES(1,'Bea'); INSERT INTO t (id, name) VALUES(2,'Belle'); INSERT INTO t (id, name) VALUES(3,'Bernice'); -----> INSERT INTO t (id, name) VALUES(1,'Bea'), (2,'Belle'),(3,'Bernice');

11、使用临时表代替复杂sql语句 创建临时表很容易,给正常的CREATE TABLE语句加上TEMPORARY关键字: CREATE TEMPORARY TABLE tmp_table ( name VARCHAR(10) NOT NULL, value INTEGER NOT NULL )
临时表将在你连接MySQL期间存在。当你断开时,MySQL将自动删除表并释放所用的空间。当然你可以在仍然连接的时候删除表并释放空间。 DROP TABLE tmp_table

12、不必要的group by 或者distinct 会无端增加系统的消耗,究期原因是程序员对数据源不了解,对程序没有自信。

13、除非主表和子表的数据量非常小,否则在两表关联的条件查询的时候,应谨慎使用in 和 not in 建议用EXISTS替代IN、用NOT EXISTS替代NOT IN的语句 在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接。在这种情况下, 使用EXISTS(或NOT EXISTS)通常将提高查询的效率。在子查询中,NOT IN子句将执行一个内部的排序和合并。无论在哪种情况下,NOT IN都是最低效的 (因为它对子查询中的表执行了一个全表遍历)。为了避免使用NOT IN ,我们可以把它改写成外连接(Outer Joins)或NOT EXISTS。

如 我要查询 Sendorder表中的冗余数据(没有和reg_person或worksite相连的数据)

sql="select Sendorder.id,Sendorder.reads,Sendorder.addtime from Sendorder where Sendorder.person_id not in(select user_id from reg_person ) or Sendorder.worksite_id not in(select id from worksite) order by Sendorder.addtime desc" 程序执行时间:40109.38毫秒

sql="select Sendorder.id,Sendorder.reads,Sendorder.addtime from Sendorder where not EXISTS (SELECT id FROM reg_person where reg_person.user_id=Sendorder.person_id) or not EXISTS (SELECT id FROM worksite where worksite.id=Sendorder.worksite_id) order by Sendorder.addtime desc" 程序执行时间:8531.25毫秒

很明显使用not EXISTS效率高多了

14、尽量避免使用多表关联的update

15、Where exists (select 1 from XXXX c where a.xx=b.xx) 这样的计算代价是相当巨大的。如果一张结果表的很多字段都需要从别的表获取,尽量使用外关联获得,不要怕sql复杂。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码