PostgreSQL聚集函数详解数据库

和大多数其它关系数据库产品一样,PostgreSQL支持聚集函数。一个聚集函数从多个输入行中计算出一个结果。比如,我们有在一个行集合上计算 count(数目), sum(总和), avg(均值), max(最大值), min(最小值)的函数。

比如,我们可以用下面的语句找出所有低温中的最高温度:

SELECT max(temp_lo) FROM weather;
 max 
----- 
  46 
(1 row)

如果我们想知道该读数发生在哪个城市,可能会用:

SELECT city FROM weather WHERE temp_lo = max(temp_lo);     -- 错!

不过这个方法不能运转,因为聚集函数 max 不能用于 WHERE 子句中。存在这个限制是因为 WHERE 子句决定哪些行可以进入聚集阶段;因此它必需在聚集函数之前计算。不过,我们可以用其它方法实现这个目的;这里我们使用子查询

SELECT city FROM weather 
    WHERE temp_lo = (SELECT max(temp_lo) FROM weather);
     city 
--------------- 
 San Francisco 
(1 row)

这样做是可以的,因为子查询是一次独立的计算,它独立于外层查询计算自己的聚集。

聚集同样也常用于 GROUP BY 子句。比如,我们可以获取每个城市低温的最高值:

SELECT city, max(temp_lo) 
    FROM weather 
    GROUP BY city;
     city      | max 
---------------+----- 
 Hayward       |  37 
 San Francisco |  46 
(2 rows)

这样每个城市一个输出。每个聚集结果都是在匹配该城市的行上面计算的。我们可以用 HAVING 过滤这些分组:

SELECT city, max(temp_lo) 
    FROM weather 
    GROUP BY city 
    HAVING max(temp_lo) < 40;
  city   | max 
---------+----- 
 Hayward |  37 
(1 row)

这样就只给出那些 temp_lo 值曾经有低于 40 度的城市。最后,如果我们只关心那些名字以S“开头的城市,我们可以用:

SELECT city, max(temp_lo) 
    FROM weather 
    WHERE city LIKE 'S%' 
    GROUP BY city 
    HAVING max(temp_lo) < 40;

语句中的 LIKE 执行模式匹配,在节9.7里有解释。

理解聚集和 SQL 的 WHEREHAVING 子句之间的关系非常重要。WHEREHAVING 的基本区别如下:WHERE 在分组和聚集计算之前选取输入行(它控制哪些行进入聚集计算),而 HAVING 在分组和聚集之后选取输出行。因此,WHERE 子句不能包含聚集函数;因为试图用聚集函数判断那些行将要输入给聚集运算是没有意义的。相反,HAVING 子句总是包含聚集函数。当然,你可以写不使用聚集的 HAVING 子句,但这样做没什么好处,因为同样的条件可以更有效地用于 WHERE 阶段。

在前面的例子里,我们可以在 WHERE 里应用城市名称限制,因为它不需要聚集。这样比在 HAVING 里增加限制更加高效,因为我们避免了为那些未通过 WHERE 检查的行进行分组和聚集计算。

 

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/tech/database/4821.html

(0)
上一篇 2021年7月16日 23:16
下一篇 2021年7月16日 23:16

相关推荐

发表回复

登录后才能评论