学习 SQL 之前需要了解的基础知识

本文为 SQL 初学者介绍了 SQL 究竟是什么,以及它能做什么事情。因为 SQL 是用来与数据库打交道的,所以,我们也介绍了一些基本的数据库术语。

一、数据库基础

你正在读这这一篇文章,这表明你需要以某种方式与数据库打交道。SQL 正是用来实现这一任务的语言,因此在学习 SQL 之前,你应该对数据库及数据库技术的某些基本概念有所了解。

你可能还没有意识到,其实自己一直在使用数据库。每当你在手机上选取联系人,或从电子邮件地址簿里查找名字时,就是在使用数据库。

你在网站上进行搜索,也是在使用数据库。你在工作中登录网络,也需要依靠数据库验证用户名和密码。即使是在自动取款机上使用 ATM 卡,也要利用数据库进行密码验证和余额查询。

虽然我们一直都在使用数据库,但对究竟什么是数据库并不十分清楚。更何况人们可能会使用同一个数据库术语表示不同的事物,这样一来,就进一步加剧了这种混乱。

因此,我们首先给出一些最重要的数据库术语,并加以说明。

1.1 数据库

数据库这个术语的用法很多,但就本博客中的 SQL 分类下的文章而言,数据库是以某种有组织的方式存储的数据集合。

最简单的办法是将数据库想象为一个文件柜。文件柜只是一个存放数据的物理位置,它不管数据是什么,也不管数据是如何组织的。

1.2 表

你往文件柜里放资料时,并不是随便将它们扔进某个抽屉就完事了的,而是在文件柜中创建文件,然后将相关的资料放入特定的文件中。

在数据库领域中,这种文件称为表。表是一种结构化的文件,可用来存储某种特定类型的数据。表可以保存顾客清单、产品目录,或者其他信息清单。

这里的关键一点在于,存储在表中的数据是同一种类型的数据或清单。决不应该将顾客的清单与订单的清单存储在同一个数据库表中,否则以后的检索和访问会很困难。应该创建两个表,每个清单一个表。

数据库中的每个表都有一个名字来标识自己。这个名字是唯一的,即数据库中没有其他表具有相同的名字。

表具有一些特性,这些特性定义了数据在表中如何存储,包括存储什么样的数据,数据如何分解,各部分信息如何命名等信息。

描述表的这组信息就是所谓的模式(schema),模式可以用来描述数据库中特定的表,也可以用来描述整个数据库(和其中表的关系)。

1.3 列和数据类型

表由列组成。列存储表中某部分的信息。

理解列的最好办法是将数据库表想象为一个网格,就像个电子表格那样。网格中每一列存储着某种特定的信息。

例如,在顾客表中,一列存储顾客编号,另一列存储顾客姓名,而地址、城市、州以及邮政编码全都存储在各自的列中。

数据库中每个列都有相应的数据类型。数据类型(datatype)定义了列可以存储哪些数据种类。

例如,如果列中存储的是数字(或许是订单中的物品数),则相应的数据类型应该为数值类型。如果列中存储的是日期、文本、注释、金额等,则应该规定好恰当的数据类型。

数据类型限定了可存储在列中的数据种类(例如,防止在数值字段中录入字符值)。数据类型还帮助正确地分类数据,并在优化磁盘使用方面起重要的作用。

因此,在创建表时必须特别关注所用的数据类型。

1.4 行

表中的数据是按行存储的,所保存的每个记录存储在自己的行内。如果将表想象为网格,网格中垂直的列为表列,水平行为表行。

例如,顾客表可以每行存储一个顾客。表中的行编号为记录的编号。

1.5 主键

表中每一行都应该有一列(或几列)可以唯一标识自己。顾客表可以使用顾客编号,而订单表可以使用订单 ID。雇员表可以使用雇员 ID。书目表则可以使用国际标准书号 ISBN。

唯一标识表中每行的这个列(或这几列)称为主键。主键用来表示一个特定的行。没有主键,更新或删除表中特定行就极为困难,因为你不能保证操作只涉及相关的行,没有伤及无辜。

表中的任何列都可以作为主键,只要它满足以下条件:

  • 任意两行都不具有相同的主键值;
  • 每一行都必须具有一个主键值(主键列不允许空值 NULL);
  • 主键列中的值不允许修改或更新;
  • 主键值不能重用(如果某行从表中删除,它的主键不能赋给以后的新行)。

主键通常定义在表的一列上,但并不是必须这么做,也可以一起使用多个列作为主键。在使用多列作为主键时,上述条件必须应用到所有列,所有列值的组合必须是唯一的(但其中单个列的值可以不唯一)。

还有一种非常重要的键,称为外键,我们在 如何使用 SQL INNER JOIN 联结两个或多个表 中介绍。

二、什么是 SQL

SQL(发音为字母 S-Q-L 或 sequel)是 Structured Query Language(结构化查询语言)的缩写。SQL 是一种专门用来与数据库沟通的语言。

与其他语言(如英语或 Java、C、PHP 这样的编程语言)不一样,SQL 中只有很少的词,这是有意而为的。设计 SQL 的目的是很好地完成一项任务——提供一种从数据库中读写数据的简单有效的方法。

SQL 有哪些优点呢?

  • SQL 不是某个特定数据库厂商专有的语言。绝大多数重要的 DBMS 支持 SQL,所以学习此语言使你几乎能与所有数据库打交道。
  • SQL 简单易学。它的语句全都是由有很强描述性的英语单词组成,而且这些单词的数目不多。
  • SQL 虽然看上去很简单,但实际上是一种强有力的语言,灵活使用其语言元素,可以进行非常复杂和高级的数据库操作。

下面我们将开始真正学习 SQL。

三、动手实践

与其他任何语言一样,学习 SQL 的最好方法是自己动手实践。为此,需要一个数据库和用来测试 SQL 语句的应用系统。

3.1 该选哪个 DBMS?

你需要用一种 DBMS 来跟着学,那么该选哪一个呢?

基本上有两种做法。一种是你在自己电脑上安装一个 DBMS(以及有关的客户端软件),这样做你用起来便利,好控制。但是对很多人来说,要学 SQL 最麻烦的一关就是安装配置 DBMS 了。

另一种做法是通过网络使用远程(或云端)DBMS,你不需要管理或安装任何东西。

要是准备在自己电脑上安装,其实可选的很多。我给两个建议:

  • MySQL(或派生的 MariaDB)是很不错的,免费,每个主流操作系统都支持,安装简便,它也是最流行的 DBMS 之一。

    MySQL 自带一个命令行工具,你可以输入 SQL 命令,但最好是使用 MySQL Workbench,你也把它下载安装吧(通常是要单独安装的)。

  • Windows 用户可以使用 Microsoft SQL Server Express。这是强大的 SQL Server 的一个免费版本,它还包括一个用户友好的客户端叫 SQL Server Management Studio。

要是准备使用远程(或云端)DBMS 的话,我的建议是:

  • 如果你是为工作需要而学习 SQL,那么你们公司应该会有 DBMS 供你使用。这样的话,你应该可以得到登录名和连接工具,可以访问 DBMS 并输入和测试你的 SQL 语句。

  • 云端 DBMS 是指运行在虚拟服务器上的 DBMS,用起来就像自己机器上安装了 DBMS,而实际上不需要安装。所有主流的云服务厂商(如谷歌、亚马逊、微软)都提供云端 DBMS。

    可是,设置云端 DBMS(包括配置远程访问)都不太简单,经常比自己安装个 DBMS 还要费事。

    有两个例外,Oracle 的 Live SQL 和 IBM 的云端 DB2,它们提供的免费版本有 Web 界面,你只需要在浏览器里输入 SQL 语句就可以了。

学习 SQL 所用到的样例表脚本 解释了什么是样例表,并详述了如何获得(或创建)样例表。

四、小结

本文介绍了什么是 SQL,它为什么很有用。因为 SQL 是用来与数据库打交道的,所以,我们也复习了一些基本的数据库术语。

我们还建议你学习 SQL 的最好方法是自己亲自动手实践。为此,需要选择一个数据库和用来测试 SQL 语句的应用系统。

(完)