如何利用 SQL UNION 操作符将多条 SELECT 语句组合成一个结果集

本文介绍如何利用 SQL UNION 操作符将多条 SELECT 语句组合成一个结果集。使用 UNION 可极大地简化复杂的 WHERE 子句,简化从多个表中检索数据的工作。

一、组合查询

多数 SQL 查询只包含从一个或多个表中返回数据的单条 SELECT 语句。但是,SQL 也允许执行多个查询(多条 SELECT 语句),并将结果作为一个查询结果集返回。

这些组合查询通常称为并(union)或复合查询(compound query)。

主要有两种情况需要使用组合查询:

  • 在一个查询中从不同的表返回结构数据;
  • 对一个表执行多个查询,按一个查询返回数据。

提示:组合查询和多个 WHERE 条件

多数情况下,组合相同表的两个查询所完成的工作与具有多个 WHERE 子句条件的一个查询所完成的工作相同。

换句话说,任何具有多个 WHERE 子句的 SELECT 语句都可以作为一个组合查询,在下面可以看到这一点。

二、创建组合查询

可用 UNION 操作符来组合数条 SQL 查询。利用 UNION,可给出多条 SELECT 语句,将它们的结果组合成一个结果集。

2.1 使用 UNION

使用 UNION 很简单,所要做的只是给出每条 SELECT 语句,在各条语句之间放上关键字 UNION

举个例子,假如需要 IllinoisIndianaMichigan 等美国几个州的所有顾客的报表,还想包括不管位于哪个州的所有的 Fun4All

当然可以利用 WHERE 子句来完成此工作,不过这次我们使用 UNION

如上所述,创建 UNION 涉及编写多条 SELECT 语句。首先来看单条语句:

1
2
3
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI');

输出:

1
2
3
4
5
cust_name       cust_contact      cust_email
-----------     -------------     ------------
Village Toys    John Smith        [email protected]
Fun4All         Jim Jones         [email protected]
The Toy Store   Kim Howard        NULL

输入:

1
2
3
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All';

输出:

1
2
3
4
cust_name       cust_contact         cust_email
-----------     -------------        ------------
Fun4All         Jim Jones            [email protected]
Fun4All         Denise L. Stephens   [email protected]

第一条 SELECTIllinoisIndianaMichigan 等州的缩写传递给 IN 子句,检索出这些州的所有行。

第二条 SELECT 利用简单的相等测试找出所有 Fun4All。你会发现有一条记录出现在两次结果里,因为它满足两次的条件。

组合这两条语句,可以如下进行:

1
2
3
4
5
6
7
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
UNION
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All';

输出:

1
2
3
4
5
6
cust_name       cust_contact        cust_email
-----------     -----------         ----------------
Fun4All         Denise L. Stephens  [email protected]
Fun4All         Jim Jones           [email protected]
Village Toys    John Smith          [email protected]
The Toy Store   Kim Howard          NULL

这条语句由前面的两条 SELECT 语句组成,之间用 UNION 关键字分隔。UNION 指示 DBMS 执行这两条 SELECT 语句,并把输出组合成一个查询结果集。

为了便于参考,这里给出使用多条 WHERE 子句而不是 UNION 的相同查询:

1
2
3
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI') OR cust_name='Fun4All';

在这个简单的例子中,使用 UNION 可能比使用 WHERE 子句更为复杂。但对于较复杂的过滤条件,或者从多个表(而不是一个表)中检索数据的情形,使用 UNION 可能会使处理更简单。

提示:UNION 的限制

使用 UNION 组合 SELECT 语句的数目,SQL 没有标准限制。但是,最好是参考一下具体的 DBMS 文档,了解它是否对 UNION 能组合的最大语句数目有限制。

注意:性能问题

多数好的 DBMS 使用内部查询优化程序,在处理各条 SELECT 语句前组合它们。

理论上讲,这意味着从性能上看使用多条 WHERE 子句条件还是 UNION 应该没有实际的差别。

不过我说的是理论上,实践中多数查询优化程序并不能达到理想状态,所以最好测试一下这两种方法,看哪种工作得更好。

2.2 UNION 规则

可以看到,UNION 非常容易使用,但在进行组合时需要注意几条规则。

  • UNION 必须由两条或两条以上的 SELECT 语句组成,语句之间用关键字 UNION 分隔(因此,如果组合四条 SELECT 语句,将要使用三个 UNION 关键字)。
  • UNION 中的每个查询必须包含相同的列、表达式或聚集函数(不过,各个列不需要以相同的次序列出)。
  • 列数据类型必须兼容:类型不必完全相同,但必须是 DBMS 可以隐含转换的类型(例如,不同的数值类型或不同的日期类型)。

说明:UNION 的列名

如果结合 UNION 使用的 SELECT 语句遇到不同的列名,那么会返回什么名字呢?比如说,如果一条语句是 SELECT prod_name,而另一条语句是 SELECT productname,那么查询结果返回的是什么名字呢?

答案是它会返回第一个名字,举的这个例子就会返回 prod_name,而不管第二个不同的名字。这也意味着你可以对第一个名字使用别名,因而返回一个你想要的名字。

这种行为带来一个有意思的副作用。由于只使用第一个名字,那么想要排序也只能用这个名字。

拿我们的例子来说,可以用 ORDER BY prod_name 对结果排序,如果写成 ORDER BY productname 就会出错,因为查询结果里没有叫作 productname 的列。

如果遵守了这些基本规则或限制,则可以将 UNION 用于任何数据检索操作。

2.3 包含或取消重复的行

回到 2.1 节,我们看看所用的 SELECT 语句。

注意到在分别执行语句时,第一条 SELECT 语句返回 3 行,第二条 SELECT 语句返回 2 行。而在用 UNION 组合两条 SELECT 语句后,只返回 4 行而不是 5 行。

UNION 从查询结果集中自动去除了重复的行;换句话说,它的行为与一条 SELECT 语句中使用多个 WHERE 子句条件一样。

因为 Indiana 州有一个 Fun4All 单位,所以两条 SELECT 语句都返回该行。使用 UNION 时,重复的行会被自动取消。

这是 UNION 的默认行为,如果愿意也可以改变它。事实上,如果想返回所有的匹配行,可使用 UNION ALL 而不是 UNION

请看下面的例子:

1
2
3
4
5
6
7
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
UNION ALL
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All';

输出:

1
2
3
4
5
6
7
cust_name       cust_contact         cust_email
-----------     -------------        ------------
Village Toys    John Smith           [email protected]
Fun4All         Jim Jones            [email protected]
The Toy Store   Kim Howard           NULL
Fun4All         Jim Jones            [email protected]
Fun4All         Denise L. Stephens   [email protected]

使用 UNION ALL,DBMS 不取消重复的行。因此,这里返回 5 行,其中有一行出现两次。

提示:UNIONWHERE

本文一开始我们说过,UNION 几乎总是完成与多个 WHERE 条件相同的工作。

UNION ALLUNION 的一种形式,它完成 WHERE 子句完成不了的工作。

如果确实需要每个条件的匹配行全部出现(包括重复行),就必须使用 UNION ALL,而不是 WHERE

2.4 对组合查询结果排序

SELECT 语句的输出用 ORDER BY 子句排序。

在用 UNION 组合查询时,只能使用一条 ORDER BY 子句,它必须位于最后一条 SELECT 语句之后。

对于结果集,不存在用一种方式排序一部分,而又用另一种方式排序另一部分的情况,因此不允许使用多条 ORDER BY 子句。

下面的例子对前面 UNION 返回的结果进行排序:

1
2
3
4
5
6
7
8
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_state IN ('IL','IN','MI')
UNION
SELECT cust_name, cust_contact, cust_email
FROM Customers
WHERE cust_name = 'Fun4All'
ORDER BY cust_name, cust_contact;

输出:

1
2
3
4
5
6
cust_name       cust_contact         cust_email
-----------     -------------        -------------
Fun4All         Denise L. Stephens   [email protected]
Fun4All         Jim Jones            [email protected]
The Toy Store   Kim Howard           NULL
Village Toys    John Smith           [email protected]

这条 UNION 在最后一条 SELECT 语句后使用了 ORDER BY 子句。

虽然 ORDER BY 子句似乎只是最后一条 SELECT 语句的组成部分,但实际上 DBMS 将用它来排序所有 SELECT 语句返回的所有结果。

说明:其他类型的 UNION

某些 DBMS 还支持另外两种 UNIONEXCEPT(有时称为 MINUS)可用来检索只在第一个表中存在而在第二个表中不存在的行;

INTERSECT 可用来检索两个表中都存在的行。实际上,这些 UNION 很少使用,因为相同的结果可利用联结得到。

提示:操作多个表

为了简单,本文中的例子都是使用 UNION 来组合针对同一表的多个查询。

实际上,UNION 在需要组合多个表的数据时也很有用,即使是有不匹配列名的表,在这种情况下,可以将 UNION 与别名组合,检索一个结果集。

三、小结

本文介绍了如何用 UNION 操作符来组合 SELECT 语句。利用 UNION,可以把多条查询的结果作为一条组合查询返回,不管结果中有无重复。

使用 UNION 可极大地简化复杂的 WHERE 子句,简化从多个表中检索数据的工作。

(完)