本文给大家介绍数据库中用来管理数据更新的重要概念——SQL 事务。简单来讲,事务就是需要在同一个处理单元中执行的一系列更新处理的集合。
一、什么是事务
估计有些读者对事务(transaction)这个词并不熟悉,它通常被用于商务贸易或者经济活动中,但是在 RDBMS 中,事务是对表中数据进行更新的单位。简单来讲,事务就是需要在同一个处理单元中执行的一系列更新处理的集合。
如 SQL 如何插入、删除和更新数据 所述,对表进行更新需要使用 INSERT
、DELETE
或者 UPDATE
三种语句。
但通常情况下,更新处理并不是执行一次就结束了,而是需要执行一系列连续的操作。这时,事务就能体现出它的价值了。
说到事务的例子,请大家思考一下下述情况。
现在,请大家把自己想象为管理 Product
(商品)表的程序员或者软件工程师。销售部门的领导对你提出了如下要求。
“某某,经会议讨论,我们决定把 运动 T 恤
的销售单价下调 1000
元,同时把 T 恤衫
的销售单价上浮 1000
元,麻烦你去更新一下数据库。”
由于大家已经学习了更新数据的方法——只需要使用 UPDATE
进行更新就可以了,所以肯定会直接回答“知道了,请您放心吧”。
此时的事务由如下两条更新处理所组成。
更新商品信息的事务
① 将
运动 T 恤
的销售单价降低1000
元1 2 3
UPDATE Product SET sale_price = sale_price - 1000 WHERE product_name = '运动T恤';
② 将
T 恤衫
的销售单价上浮1000
元1 2 3
UPDATE Product SET sale_price = sale_price + 1000 WHERE product_name = 'T恤衫';
上述 ① 和 ② 的操作一定要作为同一个处理单元执行。
如果只执行了 ① 的操作而忘记了执行 ② 的操作,或者反过来只执行了 ② 的操作而忘记了执行 ① 的操作,一定会受到领导的严厉批评。
遇到这种需要在同一个处理单元中执行一系列更新操作的情况,一定要使用事务来进行处理。
一个事务中包含多少个更新处理或者包含哪些处理,在 DBMS 中并没有固定的标准,而是根据用户的要求决定的(例如,运动 T 恤
和 T 恤衫
的销售单价需要同时更新这样的要求,DBMS 是无法了解的)。
二、创建事务
如果想在 DBMS 中创建事务,可以按照如下语法结构编写 SQL 语句。
语法 6 事务的语法
|
|
使用事务开始语句和事务结束语句,将一系列 DML 语句(INSERT
/UPDATE
/DELETE
语句)括起来,就实现了一个事务处理。
这时需要特别注意的是事务的开始语句 1。实际上,在标准 SQL 中并没有定义事务的开始语句,而是由各个 DBMS 自己来定义的。比较有代表性的语法如下所示。
SQL Server、PostgreSQL
BEGIN TRANSACTION
MySQL
START TRANSACTION
Oracle、DB2
无
例如使用之前的那两个 UPDATE
(① 和 ②)创建出的事务如代码清单 21 所示。
代码清单 21 更新商品信息的事务
SQL Server PostgreSQL
|
|
MySQL
|
|
Oracle DB2
|
|
如上所示,各个 DBMS 事务的开始语句都不尽相同,其中 Oracle 和 DB2 并没有定义特定的开始语句。
可能大家觉得这样的设计很巧妙,其实是因为标准 SQL 中规定了一种悄悄开始事务处理 2 的方法。
因此,即使是经验丰富的工程师也经常会忽略事务处理开始的时间点。大家可以试着通过询问“是否知道某个 DBMS 中事务是什么时候开始的”,来测试学校或者公司前辈的数据库知识。
反之,事务的结束需要用户明确地给出指示。结束事务的指令有如下两种。
COMMIT
——提交处理COMMIT
是提交事务包含的全部更新处理的结束指令(图 3),相当于文件处理中的覆盖保存。一旦提交,就无法恢复到事务开始前的状态了。因此,在提交之前一定要确认是否真的需要进行这些更新。
图 3 COMMIT 的流程 = 直线进行
万一由于误操作提交了包含错误更新的事务,就只能回到重新建表、重新插入数据这样繁琐的老路上了。
由于可能会造成数据无法恢复的后果,请大家一定要注意(特别是在执行
DELETE
语句的COMMIT
时尤其要小心)。
ROLLBACK
——取消处理ROLLBACK
是取消事务包含的全部更新处理的结束指令(图 4),相当于文件处理中的放弃保存。一旦回滚,数据库就会恢复到事务开始之前的状态(代码清单 22)。通常回滚并不会像提交那样造成大规模的数据损失。
图 4 ROLLBACK 的流程 = 掉头回到起点
代码清单 22 事务回滚的例子
SQL Server PostgreSQL
1 2 3 4 5 6 7 8 9 10 11 12 13
BEGIN TRANSACTION; ------------------- ① -- 将运动T恤的销售单价降低1000日元 UPDATE Product SET sale_price = sale_price - 1000 WHERE product_name = '运动T恤'; -- 将T恤衫的销售单价上浮1000日元 UPDATE Product SET sale_price = sale_price + 1000 WHERE product_name = 'T恤衫'; ROLLBACK;
上述事务处理执行之后,表中的数据不会发生任何改变。这是因为执行最后一行的 ROLLBACK
之后,所有的处理都被取消了。
因此,回滚执行起来就无需像提交时那样小心翼翼了(即使是想要提交的情况,也只需要重新执行事务处理就可以了)。
三、ACID 特性
DBMS 的事务都遵循四种特性,将这四种特性的首字母结合起来统称为 ACID 特性。这是所有 DBMS 都必须遵守的规则。
原子性(Atomicity)
原子性是指在事务结束时,其中所包含的更新处理要么全部执行,要么完全不执行,也就是要么占有一切要么一无所有。
例如,在之前的例子中,在事务结束时,绝对不可能出现
运动 T 恤
的价格下降了,而T 恤衫
的价格却没有上涨的情况。该事务的结束状态,要么是两者都执行了(
COMMIT
),要么是两者都未执行(ROLLBACK
)。从事务中途停止的角度去考虑,就能比较容易理解原子性的重要性了。
由于用户在一个事务中定义了两条
UPDATE
语句,DBMS 肯定不会只执行其中一条,否则就会对业务处理造成影响。一致性(Consistency)
一致性指的是事务中包含的处理要满足数据库提前设置的约束,如主键约束或者
NOT NULL
约束等。例如,设置了
NOT NULL
约束的列是不能更新为NULL
的,试图插入违反主键约束的记录就会出错,无法执行。对事务来说,这些不合法的 SQL 会被回滚。也就是说,这些 SQL 处理会被取消,不会执行。
一致性也称为完整性(图 5)。
图 5 保持完整性的流程
隔离性(Isolation)
隔离性指的是保证不同事务之间互不干扰的特性。该特性保证了事务之间不会互相嵌套。此外,在某个事务中进行的更改,在该事务结束之前,对其他事务而言是不可见的。
因此,即使某个事务向表中添加了记录,在没有提交之前,其他事务也是看不到新添加的记录的。
持久性(Durability)
持久性也可以称为耐久性,指的是在事务(不论是提交还是回滚)结束后,DBMS 能够保证该时间点的数据状态会被保存的特性。
即使由于系统故障导致数据丢失,数据库也一定能通过某种手段进行恢复。
如果不能保证持久性,即使是正常提交结束的事务,一旦发生了系统故障,也会导致数据丢失,一切都需要从头再来。
保证持久性的方法根据实现的不同而不同,其中最常见的就是将事务的执行记录保存到硬盘等存储介质中(该执行记录称为日志)。
当发生故障时,可以通过日志恢复到故障发生前的状态。
(完)