SQL 事务简介

  • 学习重点
  • 事务是需要在同一个处理单元中执行的一系列更新处理的集合。通过使用事务,可以对数据库中的数据更新处理的提交和取消进行管理。
  • 事务处理的终止指令包括 COMMIT(提交处理)和 ROLLBACK(取消处理)两种。
  • DBMS 的事务具有原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(Durability)四种特性。通常将这四种特性的首字母结合起来,统称为 ACID 特性。

一、什么是事务#

估计有些读者对事务(transaction)这个词并不熟悉,它通常被用于商务贸易或者经济活动中,但是在 RDBMS 中,事务是对表中数据进行更新的单位。简单来讲,事务就是需要在同一个处理单元中执行的一系列更新处理的集合

KEYWORD

  • 事务

如前几篇所述,对表进行更新需要使用 INSERTDELETE 或者 UPDATE 三种语句。但通常情况下,更新处理并不是执行一次就结束了,而是需要执行一系列连续的操作。这时,事务就能体现出它的价值了。

说到事务的例子,请大家思考一下下述情况。

现在,请大家把自己想象为管理 Product(商品)表的程序员或者软件工程师。销售部门的领导对你提出了如下要求。

“某某,经会议讨论,我们决定把运动 T 恤的销售单价下调 1000 日元,同时把 T 恤衫的销售单价上浮 1000 日元,麻烦你去更新一下数据库。”

由于大家已经学习了更新数据的方法 —— 只需要使用 UPDATE 进行更新就可以了,所以肯定会直接回答“知道了,请您放心吧”。

此时的事务由如下两条更新处理所组成。

  • 更新商品信息的事务

    ① 将运动T恤的销售单价降低 1000 日元

    1
    2
    3
    
    UPDATE Product
    SET sale_price = sale_price - 1000
    WHERE product_name = '运动T恤';
    

    ② 将T恤衫的销售单价上浮 1000 日元

    1
    2
    3
    
    UPDATE Product
    SET sale_price = sale_price + 1000
    WHERE product_name = 'T恤衫';
    

上述 ① 和 ② 的操作一定要作为同一个处理单元执行。如果只执行了 ① 的操作而忘记了执行 ② 的操作,或者反过来只执行了 ② 的操作而忘记了执行 ① 的操作,一定会受到领导的严厉批评。遇到这种需要在同一个处理单元中执行一系列更新操作的情况,一定要使用事务来进行处理。

法则 7

事务是需要在同一个处理单元中执行的一系列更新处理的集合。

一个事务中包含多少个更新处理或者包含哪些处理,在 DBMS 中并没有固定的标准,而是根据用户的要求决定的(例如,运动 T 恤和 T 恤衫的销售单价需要同时更新这样的要求,DBMS 是无法了解的)。

二、创建事务#

如果想在 DBMS 中创建事务,可以按照如下语法结构编写 SQL 语句。

语法 6 事务的语法

1
2
3
4
5
6
7
8
9
事务开始语句;

      DML语句;
      DML语句;
      DML语句;
         .
         .
         .
事务结束语句(COMMIT或者ROLLBACK;

使用事务开始语句和事务结束语句,将一系列 DML 语句(INSERT/UPDATE/DELETE 语句)括起来,就实现了一个事务处理。

这时需要特别注意的是事务的开始语句 1。实际上,在标准 SQL 中并没有定义事务的开始语句,而是由各个 DBMS 自己来定义的。比较有代表性的语法如下所示。

  • SQL Server、PostgreSQL

    BEGIN TRANSACTION

  • MySQL

    START TRANSACTION

  • Oracle、DB2

KEYWORD

  • BEGIN TRANSACTION

  • START TRANSACTION

例如使用之前的那两个 UPDATE(① 和 ②)创建出的事务如代码清单 21 所示。

代码清单 21 更新商品信息的事务

SQL Server PostgreSQL

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
BEGIN TRANSACTION;

    -- 将运动T恤的销售单价降低1000日元
    UPDATE Product
       SET sale_price = sale_price - 1000
     WHERE product_name = '运动T恤';

    -- 将T恤衫的销售单价上浮1000日元
    UPDATE Product
       SET sale_price = sale_price + 1000
     WHERE product_name = 'T恤衫';

COMMIT;

MySQL

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
START TRANSACTION;

    -- 将运动T恤的销售单价降低1000日元
    UPDATE Product
       SET sale_price = sale_price - 1000
     WHERE product_name = '运动T恤';

    -- 将T恤衫的销售单价上浮1000日元
    UPDATE Product
       SET sale_price = sale_price + 1000
     WHERE product_name = 'T恤衫';

COMMIT;

Oracle DB2

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
-- 将运动T恤的销售单价降低1000日元
UPDATE Product
   SET sale_price = sale_price - 1000
 WHERE product_name = '运动T恤';

-- 将T恤衫的销售单价上浮1000日元
UPDATE Product
   SET sale_price = sale_price + 1000
 WHERE product_name = 'T恤衫';

COMMIT;

如上所示,各个 DBMS 事务的开始语句都不尽相同,其中 Oracle 和 DB2 并没有定义特定的开始语句。可能大家觉得这样的设计很巧妙,其实是因为标准 SQL 中规定了一种悄悄开始事务处理 2 的方法。因此,即使是经验丰富的工程师也经常会忽略事务处理开始的时间点。大家可以试着通过询问“是否知道某个 DBMS 中事务是什么时候开始的”,来测试学校或者公司前辈的数据库知识。

反之,事务的结束需要用户明确地给出指示。结束事务的指令有如下两种。

  • COMMIT——提交处理

    COMMIT 是提交事务包含的全部更新处理的结束指令(图 3),相当于文件处理中的覆盖保存。一旦提交,就无法恢复到事务开始前的状态了。因此,在提交之前一定要确认是否真的需要进行这些更新。

    KEYWORD

    • COMMIT

    • 提交

    COMMIT 的流程 = 直线进行

    图 3 COMMIT 的流程 = 直线进行

    万一由于误操作提交了包含错误更新的事务,就只能回到重新建表、重新插入数据这样繁琐的老路上了。由于可能会造成数据无法恢复的后果,请大家一定要注意(特别是在执行 DELETE 语句的 COMMIT 时尤其要小心)。

    法则 8

    虽然我们可以不清楚事务开始的时间点,但是在事务结束时一定要仔细进行确认。

  • ROLLBACK——取消处理

    ROLLBACK 是取消事务包含的全部更新处理的结束指令(图 4),相当于文件处理中的放弃保存。一旦回滚,数据库就会恢复到事务开始之前的状态(代码清单 22)。通常回滚并不会像提交那样造成大规模的数据损失。

    KEYWORD

    • ROLLBACK

    • 回滚

    ROLLBACK 的流程 = 掉头回到起点

    图 4 ROLLBACK 的流程 = 掉头回到起点

    代码清单 22 事务回滚的例子

    SQL Server PostgreSQL

     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    
    BEGIN TRANSACTION; ------------------- ①
    
        -- 将运动T恤的销售单价降低1000日元
        UPDATE Product
        SET sale_price = sale_price - 1000
        WHERE product_name = '运动T恤';
    
        -- 将T恤衫的销售单价上浮1000日元
        UPDATE Product
        SET sale_price = sale_price + 1000
        WHERE product_name = 'T恤衫';
    
    ROLLBACK;
    

    特定的 SQL

    至此,我们已经知道各个 DBMS 中关于事务的语法不尽相同。代码清单 22 中的语句在 MySQL 中执行时需要将 ① 语句改写为“START TRANSACTION”,而在 Oracle 和 DB2 中执行时则无需 ① 语句(请将其删除),具体请参考 创建事务

    上述事务处理执行之后,表中的数据不会发生任何改变。这是因为执行最后一行的 ROLLBACK 之后,所有的处理都被取消了。因此,回滚执行起来就无需像提交时那样小心翼翼了(即使是想要提交的情况,也只需要重新执行事务处理就可以了)。

专栏

事务处理何时开始

之前我们说过,事务并没有标准的开始指令存在,而是根据 DBMS 的不同而不同。

实际上,几乎所有的数据库产品的事务都无需开始指令。这是因为大部分情况下,事务在数据库连接建立时就已经悄悄开始了,并不需要用户再明确发出开始指令。例如,使用 Oracle 时,数据库连接建立之后,第一条 SQL 语句执行的同时,事务就已经悄悄开始了。

像这样不使用指令而悄悄开始事务的情况下,应该如何区分各个事务呢?通常会有如下两种情况。

A: 每条 SQL 语句就是一个事务(自动提交模式

B: 直到用户执行 COMMIT 或者 ROLLBACK 为止算作一个事务

KEYWORD

  • 自动提交模式

通常的 DBMS 都可以选择其中任意一种模式。默认使用自动提交模式的 DBMS 有 SQL Server、PostgreSQL 和 MySQL 等 3 DML 语句如下所示,每一条语句都括在事务的开始语句和结束语句之中。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
BEGIN TRANSACTION;
   -- 将运动T恤的销售单价降低1000日元
   UPDATE Product
      SET sale_price = sale_price - 1000
    WHERE product_name = '运动T恤';
COMMIT;

BEGIN TRANSACTION;
   -- 将T恤衫的销售单价上浮1000日元
   UPDATE Product
      SET sale_price = sale_price + 1000
    WHERE product_name = 'T恤衫';
COMMIT;

在默认使用 B 模式的 Oracle 中,事务都是直到用户自己执行提交或者回滚指令才会结束。

自动提交的情况需要特别注意的是 DELETE 语句。如果不是自动提交,即使使用 DELETE 语句删除了数据表,也可以通过 ROLLBACK 命令取消该事务的处理,恢复表中的数据。但这仅限于明示开始事务,或者关闭自动提交的情况。如果不小心在自动提交模式下执行了 DELETE 操作,即使再回滚也无济于事了。这是一个很严重的问题,初学者难免会碰到这样的麻烦。一旦误删了数据,如果无法重新插入,是不是想哭的心都有了?所以一定要特别小心。

三、ACID 特性#

DBMS 的事务都遵循四种特性,将这四种特性的首字母结合起来统称为 ACID 特性。这是所有 DBMS 都必须遵守的规则。

KEYWORD

  • ACID 特性
  • 原子性(Atomicity)

    KEYWORD

    • 原子性(Atomicity)

    原子性是指在事务结束时,其中所包含的更新处理要么全部执行,要么完全不执行,也就是要么占有一切要么一无所有。例如,在之前的例子中,在事务结束时,绝对不可能出现运动 T 恤的价格下降了,而 T 恤衫的价格却没有上涨的情况。该事务的结束状态,要么是两者都执行了(COMMIT),要么是两者都未执行(ROLLBACK)。

    从事务中途停止的角度去考虑,就能比较容易理解原子性的重要性了。由于用户在一个事务中定义了两条 UPDATE 语句,DBMS 肯定不会只执行其中一条,否则就会对业务处理造成影响。

  • 一致性(Consistency)

    一致性指的是事务中包含的处理要满足数据库提前设置的约束,如主键约束或者 NOT NULL 约束等。例如,设置了 NOT NULL 约束的列是不能更新为 NULL 的,试图插入违反主键约束的记录就会出错,无法执行。对事务来说,这些不合法的 SQL 会被回滚。也就是说,这些 SQL 处理会被取消,不会执行。

    一致性也称为完整性(图 5)。

    KEYWORD

    • 一致性(Consistency)

    • 完整性

    保持完整性的流程

    图 5 保持完整性的流程

  • 隔离性(Isolation)

    隔离性指的是保证不同事务之间互不干扰的特性。该特性保证了事务之间不会互相嵌套。此外,在某个事务中进行的更改,在该事务结束之前,对其他事务而言是不可见的。因此,即使某个事务向表中添加了记录,在没有提交之前,其他事务也是看不到新添加的记录的。

    KEYWORD

    • 隔离性(Isolation)
  • 持久性(Durability)

    持久性也可以称为耐久性,指的是在事务(不论是提交还是回滚)结束后,DBMS 能够保证该时间点的数据状态会被保存的特性。即使由于系统故障导致数据丢失,数据库也一定能通过某种手段进行恢复。

    如果不能保证持久性,即使是正常提交结束的事务,一旦发生了系统故障,也会导致数据丢失,一切都需要从头再来。

    保证持久性的方法根据实现的不同而不同,其中最常见的就是将事务的执行记录保存到硬盘等存储介质中(该执行记录称为日志)。当发生故障时,可以通过日志恢复到故障发生前的状态。

    KEYWORD

    • 持久性(Durability)

    • 日志

请参阅#

(完)


  1. 与之相对,事务结束语句只有 COMMITROLLBACK 两种,在所有的 RDBMS 中都是通用的。 ↩︎

  2. 《标准 SQL 手册修订第 4 版》中的记述:希望大家注意事务默认开始的时间点。没有“BEGIN TRANSACTION”这样明确的开始标志。 ↩︎

  3. 例如,PostgreSQL 的用户手册中有如下记述:“PostgreSQL 中所有的 SQL 指令语句都在事务内执行。即使不执行 BEGIN,这些命令语句也会在执行时悄悄被括在 BEGINCOMMIT(如果成功的话)之间。”(《PostgreSQL 9.5.2 文档》“3-4 节事务”) ↩︎

comments powered by Disqus