1. NOT IN 执行性能差的原因
默认配置下NOT IN必然后NestLoop的执行方式,执行方式比较低效
DROP TABLE t1;
DROP TABLE t2;
CREATE TABLE t1(c1 int, c2 int);
CREATE TABLE t2(c1 int, c2 int);
INSERT INTO t1 VALUES (1, 1), (2, 2);
INSERT INTO t2 VALUES (2, 2), (3, 3);
SELECT * FROM t1 WHERE c2 NOT IN (SELECT c2 FROM t2);
NOT IN查询的执行计划如下

2. SQL改写优化方案以及改写的前置条件
当t1.c2和t2.c2都不为NULL时,上述NOT IN语句可以改写为如下NOT EXISTS语句
SELECT * FROM t1 WHERE NOT EXISTS (SELECT 1 FROM t2 WHERE t2.c2 = t1.c2);
修改之后的语句的执行计划变为如下的HashJoin,执行方式性能会明显提升

3. NOT IN改写为NOT EXISTS的等价原理


原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/317411.html