in 和 exists 的比较详解程序员

EXISTS的执行流程
select * from t1 where exists ( select null from t2 where y = x )
可以理解为:
for x in ( select * from t1 )
loop
if ( exists ( select null from t2 where y = x.x )
then
OUTPUT THE RECORD
end if
end loop

in 是把外表和内表作hash 连接，而exists是对外表作loop循环，每次loop循环再对内表进行查询。

not exists:做NL，对子查询先查，有个虚表，有确定值，所以就算子查询有NULL最终也有值返回

not in:做hash，对子查询表建立内存数组，用外表匹配，那子查询要是有NULL那外表没的匹配最终无值返回。
一直以来认为exists比in效率高的说法是不准确的。

对于in 和 exists的性能区别:
如果子查询得出的结果集记录较少，主查询中的表较大且又有索引时应该用in,反之如果外层的主查询记录较少，子查询中的表大，又有索引时使用exists。
其实我们区分in和exists主要是造成了驱动顺序的改变（这是性能变化的关键），如果是exists，那么以外层表为驱动表，先被访问，如果是IN，那么先执行子查询，所以我们会以驱动表的快速返回为目标，那么就会考虑到索引及结果集的关系了，另外，in不对NULL进行处理。

如果查询的两个表大小相当，那么用in和exists差别不大。

in操作的原理是先进行子查询操作，再进行主查询操作;exist操作是先进行主查询操作再进行子查询操作。

可以看下面的例子，注意not in的检索是从外部查询逐条匹配子查询的检索出所有的元素。匹配相等就返回true，就会输出一条元素。而not exists就不是这个搜索原理了，他是看返回的元素个数如果针对not exists返回的元素为0则为真，所以会保留Null值。

可以看下以下的例子：

in 和 exists 的比较详解程序员

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/7248.html

in 和 exists 的比较详解程序员

相关推荐

发表回复