从根上理解为什么说索引的离散型越高越好？

昨天的那篇文章中，我留了一个问题：“为什么说索引的离散型越高越好？”今天我们就一起从根上理解它！

还是那句话，任何问题，要知其然，还要知其所以然。希望通过这篇文章的讲解，你能明白两个问题。一个问题就是索引离散型；还有一个问题就是 like 查询问题，其实 like ‘xttblog%’ 也不一定走索引的。

WHERE 条件中，like ‘xttblog%’， like ‘%xttblog%’， like ‘%xttblog’，三种方式查询方式，后两种方式对于索引是无效的，有索引也不会走索引。第一种 ‘xttblog%’ 是不确定的，决定于列的离散型，理论上讲可以用到，如果发现离散情况特别差的情况下，查询优化器觉得走索引查询性能更差，还不如全表扫描。所以，关于 like 查询其实很多人也是有误解的！

离散型的好坏，决定着优化器是否走索引。

假设我们现在有一个状态字段 status，它的离散型非常的差，那么对它建立索引，对应的索引树，举例如下：

你看我这个例子，status 字段的索引离散型非常的差，如果此时搜索 status = 1 的数据，根节点判断的时候，结果是查询左子树，但是当在左子树第二层再进行判断的时候，因为左右分支都满足条件，所以很难抉择选择哪一个分支继续搜索，或者是把两个分支同时进行搜索。

如果是范围查询还好一点，因为所有的叶子节点都是有顺序的。我从最左边开始，一直遍历到不符合条件的第一条数据为止，把数据返回。这是 B+ 树的一个特点，有序性更强！
但是呢？由于离散型非常的差，优化器可能直接就选择不走索引了，因为优化器可能认为，走索引和全表扫描差不多。