PostgreSQL 语句调优

作为一名优秀的码农,对于了解Sql如何调优是很有必要的。。简单总结一下,

1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引(单表索引不能超过六个)
2.使用更多的条件,缩小查找范围
3.使用关联时,用小结果集驱动大结果集

(ps:下面的语句推荐给司机们,赶快上车)
–EXPLAIN:表示打出某sql的执行计划,看看是否走了全表,ANALYZE: 表示需要消耗的时间耗时,
EXPLAIN ANALYZE SELECT id,a FROM A;

下面是我日常用到的一些Sql优化点,大家可以借鉴一下

1. 查询字段优化 千万不要使用 SELECT * 用具体的字段列表替换 * ,不要返回用不到的字段
返回了不必有的数据,就会浪费内存,加重网络的负担降低性能 。如果表大,在表扫描的期间将表锁住,禁止其他的链接访问表,后果严重!!

–correct SQL
SELECT * FROM A;
–error SQL
SELECT id FROM A WHERE create_time >’2019-1-1′;
2. where子句 like调优
若在关键词abc前面用了“%”,会导致该Sql走全表查询,除非必要,否则不要在关键词前加%
ps: 查询耗时和字段值总长度成正比

–error SQL
SELECT id FROM A WHERE name LIKE ‘%abc%’;
–correct SQL
SELECT id FROM A WHERE name LIKE ‘abc%’;
3. where子句 避免对null做判断
该判断将导致引擎放弃使用索引而进行全表扫描,建议针对null字段设置默认值0

–error SQL
SELECT id FROM A WHERE a ISNULL;
SELECT id FROM A WHERE a NOTNULL;
–correct SQL 可以在a上设置默认值0,确保表中a列没有null值
SELECT id FROM A WHERE a =0;
SELECT id FROM A WHERE a >0;
4. where子句 避免使用 != 或者 <>
该判断将导致引擎放弃使用索引而进行全表扫描,建议将不等于 拆成 大于或者小于

–error SQL
SELECT id FROM A WHERE a !=2017;
–correct SQL
SELECT id FROM A WHERE a >2017 OR a <2017;
5. where子句 避免使用 or
使用or的子句可以分解成多个查询,并且通过union链接多个查询。它们的速度只同是否使用索引有关,如果查询使用到联合索引,用unionAll执行的效率更高,多个or字段的字句没有用到索引,改写成union的形式,再视图与索引匹配

–error SQL
SELECT id FROM A WHERE a >2017 OR a <2017;
–correct SQL
SELECT id FROM A WHERE a >2017
UNION ALL
SELECT id FROM A WHERE a <2017;
6. where子句 避免使用 NOT IN 或者 IN
NOT IN sql执行时,会转成 <> 将导致引擎放弃使用索引而进行全表扫描,不推荐使用NOT IN
IN 也会使系统无法使用索引,而只能直接搜索表中的数据(ps:如果一定要使用in 注意在in后面值的列表中,将出现最频繁的值放在最前面,出现的最少的放在最后面,减少判断的次数)

–error SQL
SELECT id FROM A WHERE a IN (2017,2018,2019);
SELECT id FROM A WHERE a IN (SELECT id FROM B);
–correct SQL 如果查询的是连续的值,可以使用BETWEEN AND 函数
SELECT id FROM A WHERE a BETWEEN 2017 AND 2019
–correct SQL 如果只是IN中的子表结果集比较大,建议使用 EXISTS
SELECT id FROM A WHERE EXISTS (SELECT 1 FROM B WHERE B.id=a)
7. where子句 EXISTS 和 IN 的使用方式
IN 是在内存中比较的,只执行一次,把B表中的所有id字段缓存起来,之后检查A表的id是否与B表中的id相等,如果id相等则将A表的记录加入到结果集中,直到遍历完A表的所有记录
EXISTS 需要查询数据库,所以当B的数据量比较大时,EXISTS效率优于IN

–error SQL
SELECT id FROM A WHERE a IN (SELECT id FROM B);
–correct SQL
SELECT id FROM A WHERE EXISTS (SELECT 1 FROM B WHERE B.id=a)
–correct SQL 如果只是IN子表查询结果,建议使用 EXISTS
SELECT id FROM A WHERE EXISTS (SELECT 1 FROM B WHERE B.id=a)
8. where子句 避免在条件左侧使用算法
在where子句中的“=”左边进行函数、算数运算或其他表达式运算,系统可能无法正确的使用索引

–error SQL
SELECT * FROM A WHERE a/2=100;
SELECT * FROM A WHERE SUBSTRING(a,1,4)=’6666’;
–correct SQL
SELECT * FROM A WHERE a=100*2;
SELECT * FROM A WHERE a LIKE ’6666%’;
9. 避免使用 DISTINCT 和 ORDER BY
它会使查询变慢,这些动作可以改在客户端执行也可以

10. GROUP BY 和 HAVING 的优化
如果能在group by的having字句之前就能剔除多余的行,所以尽量不要用他们来做剔除行的动作。最优执行顺序:select 的where字句选择所有合适的行,group用来分组统计,having用于剔除多余的分组。这样group by和having的开销小,查询快。对于大的数据进行分组和having十分消耗资源。如果group by的目的不包括计算,只是分组。Distinct更快

11. INNER JOIN 比 LEFT JOIN和RIGHT JOIN快
因为inner join是等值连接,或许返回的行数比较少.提倡使用内联INNER JOIN

12. UNION ALL 比 UNION 快
UNION在进行表链接后会筛选掉重复的记录,UNION ALL不会去除重复记录
UNION将会按照字段的顺序进行排序,UNION ALL只是简单的将两个结果合并后就返回

13. 一次更新多条记录比分多次更新每次一条快
意思就是使用批处理更有效率

–error SQL
INSERT INTO A(id,a) VALUES (1,10);
INSERT INTO A(id,a) VALUES (2,16);
–correct SQL
INSERT INTO A(id,a) VALUES (1,10),(2,16);

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/232182.html

(0)
上一篇 2022年1月19日
下一篇 2022年1月19日

相关推荐

发表回复

登录后才能评论