去重是distinct还是group by详解数据库

distinct简单来说就是用来去重的,而group by的设计目的则是用来聚合统计的,两者在能够实现的功能上有些相同之处,但应该仔细区分,因为用错场景的话,效率相差可以倍计。

单纯的去重操作使用distinct,速度是快于group by的

distinct

distinct支持单列、多列的去重方式。 
单列去重的方式简明易懂,即相同值只保留1个。 
多列的去重则是根据指定的去重的列信息来进行,即只有所有指定的列信息都相同,才会被认为是重复的信息。

干巴巴的说不好理解,示例一下:

示例数据表中的数据:
mysql> select * from talk_test; 
+----+-------+--------+ 
| id | name  | mobile | 
+----+-------+--------+ 
|  1 | xiao9 | 555555 | 
|  2 | xiao6 | 666666 | 
|  3 | xiao9 | 888888 | 
|  4 | xiao9 | 555555 | 
|  5 | xiao6 | 777777 | 
+----+-------+--------+
 
 
进行单列去重后的结果: 

mysql> select distinct(name) from talk_test; 
+-------+ 
| name  | 
+-------+ 
| xiao9 | 
| xiao6 | 
+-------+ 
2 rows in set (0.01 sec) 
 
mysql> select distinct(mobile) from talk_test; 
+--------+ 
| mobile | 
+--------+ 
| 555555 | 
| 666666 | 
| 888888 | 
| 777777 | 
+--------+ 
**只会保留指定的列的信息 
 
进行多列去重后的结果: 
mysql> select distinct name,mobile from talk_test; 
+-------+--------+ 
| name  | mobile | 
+-------+--------+ 
| xiao9 | 555555 | 
| xiao6 | 666666 | 
| xiao9 | 888888 | 
| xiao6 | 777777 | 
+-------+--------+ 
**只有所有指定的列信息都相同,才会被认定为重复的信息

 

group by使用的频率相对较高,但正如其功能一样,它的目的是用来进行聚合统计的,虽然也可能实现去重的功能,但这并不是它的长项。

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/4743.html

(0)
上一篇 2021年7月16日
下一篇 2021年7月16日

相关推荐

发表回复

登录后才能评论