oracle hash join原理及注意事项有哪些

oracle hash join原理及注意事项有哪些,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

7.3引入,仅用于CBO和等值连接,隐含参数_hash_join_enabled默认true,即使为false也可被use_hash覆盖;
Oracle依据hash_area_size/db_block_size/_hash_multiblock_io_count决定hash partition数量,hash表由若干hash partition组成,而每个partition都包含多个hash bucket

表small和big,前者会被选为驱动表,假定其结果集为s,后者为b;
构造驱动表
1 遍历s,对其每条记录按照连接列做hash运算;使用2个hash函数,暂称为func_1/func_2,其hash值为value1和value2;
2 按照value1分配bucket,把s和value2存入其中;只需查询列/连接列即可,不需要整行记录;构造hash partition时每个分区对应1个bitmap,标注该分区所属bucket是否有记录;
3 如果s > hash_area_size,将包含记录最多的partition存入temp,反复直至完成;
4 按记录数对hash partition排序,当s > hash_area_size,则尽量将较小的partition保留内存中;
构造被驱动表
5 遍历b,处理方式与步骤1一样;
6 按照value1匹配s的bucket,然后遍历其所有记录,并校验连接列是否相等;如果成功则返回记录;如果没有在内存中找到bucket,首先访问bitmap,若其记录数>0,暂将b中对应记录写入temp,若=0则直接跳过,即位图过滤;反复直至完成所有位于内存中的s和b的记录;
7 处理temp中的si和bj,分区号相等的结成对sn/bn,记录数较少的作驱动表,以value2构造hash table;反复直至完成

注意事项
1 驱动表连接列的选择性要高,若一个bucket的记录数过多,遍历时会严重消耗CPU且逻辑读不高(位于PGA中),可参照http://www.dbafan.com/blog/?p=151
2 驱动表应尽可能小,最好可全部装入内存hash_area_size

10104事件
跟踪hash join,记录hash partition/bucket以及每个bucket多少条记录

Hint
use_hash(table_1 table_2) 与 use_hash(table_1) + use_hash(table_2)等价,即并不决定连接顺序;
no_swap_join_inputs(rowsource_alias)和swap_join_inputs(rowsource_alias) 可指定驱动表和被驱动表,后者不可swap;

select  /*+ leading(table_1 table_2) use_hash(table_2) no_swap_join_inputs(table_2) */ *
from    t1 table_1, t2 table_2
where   table_1.n1 = table_1.n1;
———————————————————–
| Id  | Operation          | Name | Rows  | Bytes | Cost  |
———————————————————–
|   0 | SELECT STATEMENT   |      | 45000 |    16M|    44 |
|*  1 |  HASH JOIN         |      | 45000 |    16M|    44 |
|   2 |   TABLE ACCESS FULL| T1   |  3000 |   547K|    14 |
|   3 |   TABLE ACCESS FULL| T2   |  3000 |   547K|    14 |
———————————————————–

select  /*+ leading(table_1 table_2) use_hash(table_2) swap_join_inputs(table_2) */ *
from    t1 table_1, t2 table_2
where   table_1.n1 = table_1.n1;

———————————————————–
| Id  | Operation          | Name | Rows  | Bytes | Cost  |
———————————————————–
|   0 | SELECT STATEMENT   |      | 45000 |    16M|    44 |
|*  1 |  HASH JOIN         |      | 45000 |    16M|    44 |
|   2 |   TABLE ACCESS FULL| T2   |  3000 |   547K|    14 |
|   3 |   TABLE ACCESS FULL| T1   |  3000 |   547K|    14 |
———————————————————–

关于oracle hash join原理及注意事项有哪些问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注亿速云行业资讯频道了解更多相关知识。

原创文章,作者:Maggie-Hunter,如若转载,请注明出处:https://blog.ytso.com/tech/database/203998.html

(0)
上一篇 2021年11月28日 22:43
下一篇 2021年11月28日 22:43

相关推荐

发表回复

登录后才能评论