GaussDB(DWS)性能调优:NOT IN转NOT EXISTS的等价条件解析

1. NOT IN 执行性能差的原因

默认配置下NOT IN必然后NestLoop的执行方式,执行方式比较低效

DROP TABLE t1;
DROP TABLE t2;
CREATE TABLE t1(c1 int, c2 int);
CREATE TABLE t2(c1 int, c2 int);
INSERT INTO t1 VALUES (1, 1), (2, 2);
INSERT INTO t2 VALUES (2, 2), (3, 3);
SELECT * FROM t1 WHERE c2 NOT IN (SELECT c2 FROM t2);

NOT IN查询的执行计划如下

GaussDB(DWS)性能调优:NOT IN转NOT EXISTS的等价条件解析

2. SQL改写优化方案以及改写的前置条件

当t1.c2和t2.c2都不为NULL时,上述NOT IN语句可以改写为如下NOT EXISTS语句

SELECT * FROM t1 WHERE NOT EXISTS (SELECT 1 FROM t2 WHERE t2.c2 = t1.c2);

修改之后的语句的执行计划变为如下的HashJoin,执行方式性能会明显提升

GaussDB(DWS)性能调优:NOT IN转NOT EXISTS的等价条件解析

3. NOT IN改写为NOT EXISTS的等价原理

GaussDB(DWS)性能调优:NOT IN转NOT EXISTS的等价条件解析

GaussDB(DWS)性能调优:NOT IN转NOT EXISTS的等价条件解析

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/317411.html

(0)
上一篇 10小时前
下一篇 10小时前

相关推荐

发表回复

登录后才能评论