今天微信群里一位网友发了一个问题:“mysql 根据时间进行过滤,查询速度特别慢,需要 30 多秒”。然后我问她,数据库中总数据量大概是多少,她告诉我 explain 执行结果中的 rows 显示有 100 多万条。我告诉她这个 rows 不准确。那么 explain 执行结果中的 rows 到底代表了什么意思?本文我们一起来学习一下!
EXPLAIN 有什么用?
MySQL 提供了一个 EXPLAIN 命令,它可以对 SELECT 语句进行分析,并输出 SELECT 执行的详细信息,以供开发人员针对性优化。
EXPLAIN 如何用?
EXPLAIN 命令用法十分简单,在 SELECT 语句前加上 EXPLAIN 就可以了,例如:
EXPLAIN SELECT * FROM xttblog WHERE id < 300;
为了演示 EXPLAIN,我们先创建一张表 xttblog。
CREATE TABLE `xttblog` ( `id` BIGINT(20) NOT NULL AUTO_INCREMENT, `name` VARCHAR(50) NOT NULL DEFAULT '', `age` INT(11) DEFAULT NULL, PRIMARY KEY (`id`), KEY `name_index` (`name`) ) ENGINE = InnoDB DEFAULT CHARSET = utf8 INSERT INTO xttblog (name, age) VALUES ('xys', 20); INSERT INTO xttblog (name, age) VALUES ('a', 21); INSERT INTO xttblog (name, age) VALUES ('b', 23); INSERT INTO xttblog (name, age) VALUES ('c', 50); INSERT INTO xttblog (name, age) VALUES ('d', 15); INSERT INTO xttblog (name, age) VALUES ('e', 20); INSERT INTO xttblog (name, age) VALUES ('f', 21); INSERT INTO xttblog (name, age) VALUES ('g', 23); INSERT INTO xttblog (name, age) VALUES ('h', 50); INSERT INTO xttblog (name, age) VALUES ('i', 15);
EXPLAIN 命令的输出内容
EXPLAIN 命令输出的格式大致如下:
mysql> explain select * from xttblog where id = 2/G *************************** 1. row *************************** id: 1 select_type: SIMPLE table: xttblog partitions: NULL type: const possible_keys: PRIMARY key: PRIMARY key_len: 8 ref: const rows: 1 filtered: 100.00 Extra: NULL 1 row in set, 1 warning (0.00 sec)
对于每个字段的解释如下:
- id: SELECT 查询的标识符. 每个 SELECT 都会自动分配一个唯一的标识符.
- select_type: SELECT 查询的类型.
- table: 查询的是哪个表
- partitions: 匹配的分区
- type: join 类型
- possible_keys: 此次查询中可能选用的索引
- key: 此次查询中确切使用到的索引.
- ref: 哪个字段或常数与 key 一起被使用
- rows: 显示此查询一共扫描了多少行. 这个是一个估计值.
- filtered: 表示此查询条件所过滤的数据的百分比
- extra: 额外的信息
每个字段的含义我们可能都了解了,但是每个字段都对应好几个值。那么每个值又代表什么意思呢?下面我们针对每个关键字代表什么意思,再来单独解释一下!
select_type
select_type 表示了查询的类型, 它的常用取值有:
- SIMPLE:表示此查询不包含 UNION 查询或子查询
- PRIMARY:表示此查询是最外层的查询
- UNION:表示此查询是 UNION 的第二或随后的查询
- DEPENDENT UNION:UNION 中的第二个或后面的查询语句, 取决于外面的查询
- UNION RESULT:UNION 的结果
- SUBQUERY:子查询中的第一个 SELECT
- DEPENDENT SUBQUERY:子查询中的第一个 SELECT,取决于外面的查询。即子查询依赖于外层查询的结果
最常见的查询类别应该是 SIMPLE 了,比如当我们的查询没有子查询,也没有 UNION 查询时,那么通常就是 SIMPLE 类型。
table
table,表示查询涉及的表或衍生表。xttblog 代表的就是 xttblog 表。<union1,2> 代表的就是,第一条和第二条查询出来的结果的合集。
partitions
partitions: NULL。代表的是是否使用了分区,null 表明没有分区。
type
type 字段比较重要,它提供了判断查询是否高效的重要依据依据。通过 type 字段,我们判断此次查询是全表扫描还是索引扫描等。
type 常用的取值有:
- system: 表中只有一条数据。这个类型是特殊的 const 类型
- const: 针对主键或唯一索引的等值查询扫描,最多只返回一行数据。const 查询速度非常快,因为它仅仅读取一次即可
- eq_ref: 此类型通常出现在多表的 join 查询,表示对于前表的每一个结果,都只能匹配到后表的一行结果。并且查询的比较操作通常是 =,查询效率较高
- ref: 此类型通常出现在多表的 join 查询,针对于非唯一或非主键索引,或者是使用了最左前缀规则索引的查询
- range: 表示使用索引范围查询, 通过索引字段范围获取表中部分数据记录. 这个类型通常出现在 =,<>,>,>=,<,<=,IS NULL,<=>,BETWEEN,IN() 操作中。当 type 是 range 时,那么 EXPLAIN 输出的 ref 字段为 NULL,并且 key_len 字段是此次查询中使用到的索引的最长的那个
- index: 表示全索引扫描(full index scan)和 ALL 类型类似,只不过 ALL 类型是全表扫描,而 index 类型则仅仅扫描所有的索引,而不扫描数据。index 类型通常出现在: 所要查询的数据直接在索引树中就可以获取到,而不需要扫描数据。当是这种情况时,Extra 字段 会显示 Using index
- ALL: 表示全表扫描,这个类型的查询是性能最差的查询之一。通常来说,我们的查询不应该出现 ALL 类型的查询,因为这样的查询在数据量大的情况下,对数据库的性能是巨大的灾难。如一个查询是 ALL 类型查询,那么一般来说可以对相应的字段添加索引来避免
type 类型的性能比较
通常来说,不同的 type 类型的性能关系不一样。ALL < index < range ~ index_merge < ref < eq_ref < const < system。ALL 类型因为是全表扫描,因此在相同的查询条件下, 它是速度最慢的。而 index 类型的查询虽然不是全表扫描,但是它扫描了所有的索引,因此比 ALL 类型的稍快。后面的几种类型都是利用了索引来查询数据,因此可以过滤部分或大部分数据, 因此查询效率就比较高了。
possible_keys
possible_keys 表示 MySQL 在查询时,能够使用到的索引。注意,即使有些索引在 possible_keys 中出现,但是并不表示此索引会真正地被 MySQL 使用到。MySQL 在查询时具体使用了哪些索引,由 key 字段决定。
key
此字段是 MySQL 在当前查询时所真正使用到的索引。
key_len
表示查询优化器使用了索引的字节数。这个字段可以评估组合索引是否完全被使用,或只有最左部分字段被使用到。key_len 的计算规则如下:
-
字符串
- char(n): n 字节长度
- varchar(n): 如果是 utf8 编码, 则是 3 n + 2字节; 如果是 utf8mb4 编码, 则是 4 n + 2 字节
-
数值类型:
- TINYINT: 1字节
- SMALLINT: 2字节
- MEDIUMINT: 3字节
- INT: 4字节
- BIGINT: 8字节
-
时间类型
- DATE: 3字节
- TIMESTAMP: 4字节
- DATETIME: 8字节
- 字段属性: NULL 属性 占用一个字节。如果一个字段是 NOT NULL 的, 则没有此属性
rows
rows 也是一个重要的字段。MySQL 查询优化器根据统计信息,估算 SQL 要查找到结果集需要扫描读取的数据行数。这个值非常直观显示 SQL 的效率好坏,原则上 rows 越少越好。
Extra
EXplain 中的很多额外的信息会在 Extra 字段显示,常见的有以下几种内容:
- Using filesort:当 Extra 中有 Using filesort 时,表示 MySQL 需额外的排序操作,不能通过索引顺序达到排序效果。一般有 Using filesort,都建议优化去掉,因为这样的查询 CPU 资源消耗大。
- Using index:"覆盖索引扫描",表示查询在索引树中就可查找所需数据,不用扫描表数据文件,往往说明性能不错
- Using temporary:查询有使用临时表,一般出现于排序,分组和多表 join 的情况,查询效率不高,建议优化
explain 执行结果中的 rows 是什么意思?
前面我已经说了,rows 显示此查询一共扫描了多少行,这个是一个估计值。所以它不准确。那么 rows 究竟是怎么计算出来的呢?为什么不准确?
rows在官网的文档中有解释:http://dev.mysql.com/doc/refman/5.7/en/explain-output.html#explain_rows。
The rows column indicates the number of rows MySQL believes it must examine to execute the query.
这个 rows 就是 mysql 认为必须要逐行去检查和判断的记录的条数。举个例子来说,假如有一个语句 select * from t where column_a = 1 and column_b = 2; 全表假设有 100 条记录,column_a 字段有索引(非联合索引),column_b没有索引。column_a = 1 的记录有 20 条, column_a = 1 and column_b = 2 的记录有 5 条。
那么最终查询结果应该显示 5 条记录。 explain 结果中的 rows 应该是 20。因为这 20 条记录 mysql 引擎必须逐行检查是否满足 where 条件。
参考资料
- http://dev.mysql.com/doc/refman/5.7/en/explain-output.html#explain_rows
: » MySQL 性能优化神器 Explain 使用教程
原创文章,作者:506227337,如若转载,请注明出处:https://blog.ytso.com/252391.html