oracle总共只有两种基本的数据访问途径:全扫描或者索引扫描 。统计信息在优化器准备确定最优方法的过程中扮演了关键的角色。
全扫描访问方法:
当对一个对象进行全扫描时,与该对象相关的所有数据块都必须取出并进行处理,以确定块中所包含的数据行是否是你的查询所需要的。请记住ORACLE必须将整个数据块读取到内存中以取得这个块中所存储的数据行的数据。因此,当发生全扫描时,实际上优化器需要考虑两件事:必须读取多少数据块以及每个数据块中有多少数据将被舍弃。
基于数据存储方式的不同,优化器的执行计划选择也可能会不同。
请记住,全扫描是否为高效的选择,取决于需要访问的数据块个数以及最终的结果集行数。数据的存储方式在决策过程中扮演了重要的角色。此外,全扫描是否为高效选择的另一个关键因素是舍弃。所访问数据块数目以及舍弃的数量越大,全表扫描的成本也就越高。
随着时间的推移,新的行被插入到表中使得表变得更大,舍弃这么多数据行的成本也不断增加,到一定程度时优化器将会切换到使用索引扫描运算。优化器决定进行切换的点并不一定是你实现最佳性能的点。你可以通过使用提示来强制优化器使用索引,以测试在哪个点上使用索引更有意义。
全扫描运算将会进行多块读取。也就是说一个单独的IO调用将会请求多个块而不仅仅是一个。所请求的数据块数目是可变的,实际上可以是从一个到db_file_multiblock_read_count参数所指定的数目范围之间的任意个。例如,如果这个参数设定为16,而表中有160个块,可以只通过10次调用就可以获取所有的数据块。
关于全表扫描需要注意的最后一点,当对扫描进行多块读取调用时,ORACLE将最多读取到位于表中高水位线的数据块。高水位线标出了最后一块有数据写入的数据块。即使几乎所有数据行都被删除了并且一些块实际上已经完全变成空的了,高水位线还是保持不变。当进行全扫描运算的时候,到高水位线为止的所有数据块都将被读取并扫描,即使它们是空的。这就意味着许多实际上不需要读取的空数据块也被读取了。
索引访问方法:
默认的索引类型是B-树索引。索引建立在表中的一个或多个列或者是列的表达式上,将列值和行编号(ROWID)一起存储。在索引中还保存着一些其他信息,但对你来说仅需要关心列值和行编号即可。行编号是一个用来唯一标记表中行的伪列。它是物理表中行数据的内部地址,包含两个地址,其一为指向数据表中包含该行的块所存放数据文件的地址,另一个是可以直接定位到数据行自身的这一行在数据块中的地址。
也就是说对于通过索引扫描所获取的每一行,都至少需要访问两个数据块:至少一个索引块和一个数据块。
索引扫描类型包括:索引范围扫描、索引唯一扫描、索引全表扫描、索引跳跃扫描、索引快速扫描。
索引的聚簇因子统计信息帮助优化器生成使用索引的成本信息,并且是表中建立了索引的数据排序优良度的一个度量值。索引的聚簇因子向优化器表明了具有同样索引值的数据行是不是存放在同一个或连续的一系列数据块中,或者数据行是否被分散存放在表的多个数据块中。
注意:聚簇因子与表中数据而不是与索引相关。因此,重建索引对它没有任何影响。
索引唯一扫描(INDEX UNIQUE SCAN)
当谓语中包含使用unique或primary key索引的列作为条件的时候就会选用索引唯一扫描。这种类型的索引能够保证对于某个特定的值只返回一行数据。
索引范围扫描(INDEX RANGE SCAN)
当谓语中包含将会返回一定范围数据的条件时就会选用索引范围扫描。范围越大,就越有可能会选用全扫描运算来代替它。也有一些情况下你觉得应该使用索引范围扫描,但实际上没有使用。例如,如果你使用一个以通配符开头的条件如’%abc’的LIKE运算符,优化器将不会选用该列上的索引范围扫描,因为条件太宽泛了。另一个类似的情况就是,当你有一个使用组合索引中非引导列的谓语时。在这种情况,将更可能选择使用索引跳跃扫描。
注意:索引范围扫描的最后一个精妙之处在于它能够使用一个升序排列的索引(默认值)来返回降序排列的数据行。
索引全表扫描(INDEX FULL SCAN)
有好几种情况下都将会选择索引全扫描,包括:当没有谓语但是所需获取列的列表可以通过其中一列的索引来获得,谓语中包含一个位于索引中非引导列上的条件,或者数据可以通过一个排过序的索引来获取并且会省去单独的排序步骤。索引全扫描运算将会扫描索引结构中的每一个叶子块,读取每个条目的行编号,并取出数据行。每个叶子块都要被访问。
这通常比全表扫描效率要高,因为每一个索引块要比表数据块包含更多条目,从而总的需要访问的块数也就相应减少。在查询字段列表中所有字段都是索引条目的一部分的时候,就能够完全跳过访问表的步骤。这就意味着选用索引全扫描比读取所有的表数据块效率更高。
注意:索引全扫描也能够按降序来读取数据(升序数据)以避免进行单独的排序。对于索引全扫描还有另外一个最优方法,当需要查询某一列的最小或最大值而这一列又是索引列的时候。
索引跳跃扫描(INDEX SKIP SCAN)
当谓语中包含位于索引中非引导列上的条件,并且引导列的值是唯一 的时候会选择索引跳跃扫描。在早期的ORACLE版本中,如果一个谓语使用了索引中的非引导列,则该索引不能被选用。在9以后的版本中通过引入索引跳跃扫描得到了改变。
索引快速全扫描
索引快速全扫描更像全表扫描而不像其它类型的索引扫描。当选用索引快速全扫描时,所有索引块都将通过多块读取来进行。这种类型的索引扫描是用来在查询列表中所有字段都包含在索引中并且索引中至少有一列具有非空约束时替代全表扫描的。在这种情况下,数据通过索引来进行访问而不必访问表数据块。与其他索引扫描类型不同,索引快速全扫描并不能用来避免排序,因为数据块是通过无序的多表读取来的。
总之,索引快速全扫描运算依赖于非空约束的,如果没有这样的约束,将会选择全表扫描。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/7242.html