SQL 聚集函数:AVG、COUNT、MAX、MIN 和 SUM

本文介绍什么是 SQL 的聚集函数,如何利用它们汇总表的数据。这些 SQL 聚集函数很高效,它们返回结果一般比你在自己的客户端应用程序中计算要快得多。

一、SQL 聚集函数

我们经常需要汇总数据而不用把它们实际检索出来,为此 SQL 提供了专门的函数。使用这些 SQL 聚集函数,SQL 查询可用于检索数据,以便分析和报表生成。这种类型的检索例子有:

  • 确定表中行数(或者满足某个条件或包含某个特定值的行数);
  • 获得表中某些行的和;
  • 找出表列(或所有行或某些特定的行)的最大值、最小值、平均值。

上述例子都需要汇总出表中的数据,而不需要查出数据本身。因此,返回实际表数据纯属浪费时间和处理资源(更不用说带宽了)。再说一遍,我们实际想要的是汇总信息。

为方便这种类型的检索,SQL 给出了 5 个聚集函数,见表 1。这些函数能进行上述检索。与 SQL 函数的用法 介绍的数据处理函数不同,SQL 的聚集函数在各种主要 SQL 实现中得到了相当一致的支持。

聚集函数(aggregate function)

对某些行运行的函数,计算并返回一个值。

表 1 SQL 聚集函数

函数说明
AVG()返回某列的平均值
COUNT()返回某列的行数
MAX()返回某列的最大值
MIN()返回某列的最小值
SUM()返回某列值之和

下面说明各 SQL 聚集函数的使用。

1.1 SQL 聚集函数 AVG()

SQL AVG() 通过对表中行数计数并计算其列值之和,求得该列的平均值。AVG() 可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。

下面的例子使用 SQL 聚集函数 AVG() 返回 Products 表中所有产品的平均价格:

1
2
SELECT AVG(prod_price) AS avg_price
FROM Products;

输出:

1
2
3
avg_price
-------------
6.823333

SELECT 语句 返回值 avg_price,它包含 Products 表中所有产品的平均价格。如 SQL 计算字段 中所述,avg_price 是一个别名。

SQL 聚集函数 AVG() 也可以用来确定特定列或行的平均值。下面的例子返回特定供应商所提供产品的平均价格:

1
2
3
SELECT AVG(prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';

输出:

1
2
3
avg_price
-----------
3.8650

这条 SELECT 语句与前一条的不同之处在于,它包含了 WHERE 子句。此 WHERE 子句仅过滤出 vend_idDLL01 的产品,因此 avg_price 中返回的值只是该供应商产品的平均值。

注意:只用于单个列

SQL 聚集函数 AVG() 只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个 SQL AVG() 函数。只有一个例外是要从多个列计算出一个值时,本问后面会讲到。

说明:NULL

SQL AVG() 函数忽略列值为 NULL 的行。

1.2 SQL 聚集函数 COUNT()

SQL COUNT() 函数进行计数。可利用 COUNT() 确定表中行的数目或符合特定条件的行的数目。

SQL COUNT() 函数有两种使用方式:

  • 使用 COUNT(*) 对表中行的数目进行计数,不管表列中包含的是空值(NULL)还是非空值。
  • 使用 COUNT(column) 对特定列中具有值的行进行计数,忽略 NULL 值。

下面的例子返回 Customers 表中顾客的总数:

1
2
SELECT COUNT(*) AS num_cust
FROM Customers;

输出:

1
2
3
num_cust
--------
5

在此例子中,利用 SQL 聚集函数 COUNT(*) 对所有行计数,不管行中各列有什么值。计数值在 num_cust 中返回。

下面的例子只对具有电子邮件地址的客户计数:

1
2
SELECT COUNT(cust_email) AS num_cust
FROM Customers;

输出:

1
2
3
num_cust
--------
3

这条 SELECT 语句使用 COUNT(cust_email)cust_email 列中有值的行进行计数。在此例子中,cust_email 的计数为 3(表示 5 个顾客中只有 3 个顾客有电子邮件地址)。

说明:NULL

如果指定列名,则 SQL COUNT() 函数会忽略指定列的值为 NULL 的行,但如果 COUNT() 函数中用的是星号(*),则不忽略。

1.3 SQL 聚集函数 MAX()

SQL MAX() 返回指定列中的最大值。MAX() 要求指定列名,如下所示:

1
2
SELECT MAX(prod_price) AS max_price
FROM Products;

输出:

1
2
3
max_price
----------
11.9900

这里,SQL 聚集函数 MAX() 返回 Products 表中最贵物品的价格。

提示:对非数值数据使用 MAX()

虽然 SQL 聚集函数 MAX() 一般用来找出最大的数值或日期值,但许多(并非所有)DBMS 允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。

在用于文本数据时,SQL MAX() 返回按该列排序后的最后一行。

说明:NULL

MAX() 函数忽略列值为 NULL 的行。

1.4 SQL 聚集函数 MIN()

SQL MIN() 的功能正好与 SQL MAX() 功能相反,它返回指定列的最小值。与 MAX() 一样,MIN() 要求指定列名,如下所示:

1
2
SELECT MIN(prod_price) AS min_price
FROM Products;

输出:

1
2
3
min_price
----------
3.4900

其中 SQL 聚集函数 MIN() 返回 Products 表中最便宜物品的价格。

提示:对非数值数据使用 MIN()

虽然 SQL 聚集函数 MIN() 一般用来找出最小的数值或日期值,但许多(并非所有)DBMS 允许将它用来返回任意列中的最小值,包括返回文本列中的最小值。

在用于文本数据时,SQL MIN() 返回该列排序后最前面的行。

说明:NULL

MIN() 函数忽略列值为 NULL 的行。

1.5 SQL 聚集函数 SUM()

SQL SUM() 用来返回指定列值的和(总计)。

下面举一个例子,OrderItems 包含订单中实际的物品,每个物品有相应的数量。可如下检索所订购物品的总数(所有 quantity 值之和):

1
2
3
SELECT SUM(quantity) AS items_ordered
FROM OrderItems
WHERE order_num = 20005;

输出:

1
2
3
items_ordered
----------
200

函数 SUM(quantity) 返回订单中所有物品数量之和,WHERE 子句保证只统计某个物品订单中的物品。

SQL 聚集函数 SUM() 也可以用来合计计算值。在下面的例子中,合计每项物品的 item_price*quantity,得出总的订单金额:

1
2
3
SELECT SUM(item_price*quantity) AS total_price
FROM OrderItems
WHERE order_num = 20005;

输出:

1
2
3
total_price
----------
1648.0000

函数 SUM(item_price*quantity) 返回订单中所有物品价钱之和,WHERE 子句同样保证只统计某个物品订单中的物品。

提示:在多个列上进行计算

如本例所示,利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。

说明:NULL

SUM() 函数忽略列值为 NULL 的行。

二、聚集不同值

以上 5 个 SQL 聚集函数都可以如下使用。

  • 对所有行执行计算,指定 ALL 参数或不指定参数(因为 ALL 是默认行为)。
  • 只包含不同的值,指定 DISTINCT 参数。

提示:ALL 为默认

ALL 参数不需要指定,因为它是默认行为。如果不指定 DISTINCT,则假定为 ALL

下面的例子使用 AVG() SQL 函数返回特定供应商提供的产品的平均价格。它与上面的 SELECT 语句相同,但使用了 DISTINCT 参数,因此平均值只考虑各个不同的价格:

1
2
3
SELECT AVG(DISTINCT prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';

输出:

1
2
3
avg_price
-----------
4.2400

可以看到,在使用了 DISTINCT 后,此例子中的 avg_price 比较高,因为有多个物品具有相同的较低价格。排除它们提升了平均价格。

注意:DISTINCT 不能用于 COUNT(*)

如果指定列名,则 DISTINCT 只能用于 SQL 聚集函数 COUNT()DISTINCT 不能用于 COUNT(*)。类似地,DISTINCT 必须使用列名,不能用于计算或表达式。

提示:将 DISTINCT 用于 MIN()MAX()

虽然 DISTINCT 从技术上可用于 SQL MIN() 和 SQL MAX(),但这样做实际上没有价值。一个列中的最小值和最大值不管是否只考虑不同值,结果都是相同的。

说明:其他聚集参数

除了这里介绍的 DISTINCTALL 参数,有的 DBMS 还支持其他参数,如支持对查询结果的子集进行计算的 TOPTOP PERCENT

为了解具体的 DBMS 支持哪些参数,请参阅相应的文档。

三、组合 SQL 聚集函数

目前为止的所有 SQL 聚集函数例子都只涉及单个函数。但实际上,SELECT 语句可根据需要包含多个聚集函数。请看下面的例子:

1
2
3
4
5
SELECT COUNT(*) AS num_items,
       MIN(prod_price) AS price_min,
       MAX(prod_price) AS price_max,
       AVG(prod_price) AS price_avg
FROM Products;

输出:

1
2
3
num_items      price_min           price_max           price_avg
----------     ---------------     ---------------     ---------
9              3.4900              11.9900             6.823333

这里用单条 SELECT 语句执行了 4 个聚集计算,返回 4 个值(Products 表中物品的数目,产品价格的最高值、最低值以及平均值)。

注意:取别名

在指定别名以包含某个 SQL 聚集函数的结果时,不应该使用表中实际的列名。虽然这样做也算合法,但许多 SQL 实现不支持,可能会产生模糊的错误消息。

四、小结

SQL 聚集函数用来汇总数据。SQL 支持 5 个聚集函数,可以用多种方法使用它们,返回所需的结果。这些 SQL 聚集函数很高效,它们返回结果一般比你在自己的客户端应用程序中计算要快得多。

(完)