查询功能是SQL语句最重要的功能,查询操作也是数据库系统最常用的操作。学习SQL查询语句,首先要弄清楚的是查询语句用到的关键字以及查询语句的执行顺序。SQL语言的一个特点在于,它是一种声明式语句,执行顺序并不按照语法顺序执行,所以不了解SQL执行顺序的话会在进行比较复杂的查询时很容易产生错误,在嵌套子查询时很容易发生别名错误、查询表错误的问题。
SQL的常用函数:
- AVG(可计算属性):求某个可计算属性的平均数
- SUM(可计算属性):求某个可计算属性的总和
- COUNT(属性):求某个属性在中间表中出现的次数
- MAX(可计算属性):求某个可计算属性的最大值
- MIN(可计算属性):求某个可计算属性的最小值
- ......
SQL查询语言可以使用的内置函数非常多,而且不同的数据库支持的函数有微小的差别,具体还要在实践中学习,只要知道SQL语言提供了丰富强大的可用函数即可,而且函数经常和GROUP BY分组配合使用以达成查找目的。
查询语句的语法顺序:
- SELECT [DISTINCT]:用于从表中选取需要的数据,返回的结果为一个结果集(是一个查询表),DISTINCT可选关键字表示不显示重复元组
- FROM:用于指定表查询SELECT的目标,与SELECT连用,表示从什么地方进行数据选取
- WHERE:用于规定表查询的条件,条件语句
- GROUP BY:用于进行分组查询,按指定的属性的值进行分组,之后的SELECT、HAVING子句也按分组后进行处理
- HAVING:用于对分组后的表查询进行过滤,对SELECT结果进行一次过滤再输出,只出现在GROUP BY后面
- UNION [ALL]:用于对两个结果集进行交运算,ALL可选关键字表示保留合并后的重复内容
- ORDER BY:用于对查询结果进行排序
查询语句的执行顺序:
- FROM
- WHERE
- GROUP BY
- HAVING
- SELECT [DISTINCT]
- UNION [ALL]
- ORDER BY
可见SQL语句的执行顺序和语法顺序是不同的,执行一条SQL查询语句的顺序应该是:
- 通过FROM子句将数据从硬盘加载到内存中,或者将内存中的表提取出来。先把数据的来源取出才能进行后续查询
- 通过WHERE子句对FROM得到的表进行初步筛选
- GROUP BY语句将初步筛选得到的表进行分组(所以同一层的WHERE子句是无法对分组后的内容进行筛选的)
- HAVING语句对分组后的数据进行过滤,即进行了进一步的筛选(WHERE筛选分组前的数据,HAVING筛选分组后的数据)
- SELECT子句从上面步骤产生的临时表中选取目的数据生成查询表
- UNION子句将多个SELECT查询结果进行集合交运算
- ORDER BY对查询结果按照某个属性进行排序
其中SQL查询语句有几点是要注意的:①执行语句首先执行的是FROM子句,SELECT子句是在查找基本完成时用于产生结果集的;②GROUP BY子句是一个值得注意的关键字SQL查询经常需要对数据进行分组计算操作,要注意区分哪里是分组后,哪里是分组前;③并非所有的SQL都按照以上顺序执行但是大同小异,SELECT语句会在主要的筛选操作完成之后才会执行。
查找示例:
##SQL_ServerSELECT [Customer],SUM([OrderPrice]) FROM [Orders] WHERE [Customer]='Bush' OR [Customer]='Adams' GROUP BY [Customer] HAVING SUM([OrderPrice])>1500
示例解析:
- 从项目表(Orders)中查找Bush、Adams两位客户(Customer)的项目总金额(SUM(OrderPrice))是否超过1500元,并显示满足要求的客户的名称和项目总金额
- 执行FROM语句:将Order表导入到内存
- 执行WHERE语句:筛选Order表中的Customer属性 ,将Customer的值为'Bush'、'Adams'的元组筛选出来
- 执行GROUP BY语句:将WHERE筛选结果按Customer的值进行分组,分为'Bush'、'Adams'两组
- 执行HAVING语句:分组结果分别求每一组的OrderPrice的和,选取SUM(OrderPrice)的值大于1500的元组
- 执行SELECT语句:在上面步骤得到的中间表选择其中的Customer、SUM(OrderPrice)两个属性组成一个结果表并显示出来
所谓“实践出真知”,接下来通过练习学习SQL查询语句的设计方法:
(博主使用的是MySql+HeidiSQL进行实验)
构建一个Lebery数据库,代码如下:
#MySQL CREATE DATABASE Labery USE Labery #MySQL CREATE TABLE `book` ( `bno` ) NOT NULL, `category` ) NULL DEFAULT NULL, `title` ) NOT NULL, `press` ) NOT NULL, `book_year` ) NOT NULL, `author` ) NULL DEFAULT NULL, `price` ,) NOT NULL, `book_title` ) NOT NULL, PRIMARY KEY (`bno`)) CREATE TABLE `card` ( `cno` ) NOT NULL, `cname` ) NOT NULL, `department` ) NULL DEFAULT NULL, `type` ) NOT NULL, PRIMARY KEY (`cno`)) CREATE TABLE `borrow` ( `cno` ) NOT NULL, `bno` ) NOT NULL, `borrow_date` TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP, `return_date` TIMESTAMP NULL DEFAULT NULL, PRIMARY KEY (`cno`, `bno`, `borrow_date`), INDEX `bno` (`bno`), CONSTRAINT `borrow_ibfk_1` FOREIGN KEY (`cno`) REFERENCES `card` (`cno`), CONSTRAINT `borrow_ibfk_2` FOREIGN KEY (`bno`) REFERENCES `book` (`bno`))
Lebery
(Labery数据库中有三个表借书证表(Card)、图书表(Book)、借阅表(Borrow))
为构建的表添加数据:
#Book表 ,,,) ,,,) ,,,) ,,,) ,,,) ,,,) ,,,) ,,) ,,) ,,,) ,,); ,,,); ,,,); ,,); ,,); #Card表 ,'张扬','翻译3班','S'); ,'陈军','物联网2班','T'); ,'王宏','翻译3班','T'); ,'晓璐','自动化1班','S'); ,'章尹文','电子6班','S'); ,'钟世聪','计算机6班','T'); ,'蔡妍','计算机2班','T'); ,'朱蕴灵','软件工程5班','S'); ,'洪道德','应用化学4班','S'); ,'曾黎德','自动化3班','S'); ,'王欢','应用化学2班','S'); ,'熊恭','应用化学4班','T'); ,'温丽萍','电子6班','T'); ,'吴肖平','计算机2班','S'); ,'欧阳辉','物联网3班','S'); #Borrow表 ,,'2017.8.28 22:34:22','2017.12.12 10:23:34'); ,,'2018.1.22 20:31:32'); ,,'2016.2.13 15:36:23'); ,,'2014.7.28 15:14:56','2015.11.10 18:29:22'); ,,'2018.3.22 10:35:14','2018.5.23 9:55:14'); ,); ,,'2016.1.21 18:44:22'); ,,'2017.9.30 21:45:12','2018.1.15 14:24:10'); ,,'2017.12.24 16:13:16'); ,,'2018.3.28 14:33:54'); ,,'2017.12.19 16:41:41'); ,); ,); ,,'2017.10.18 19:32:47'); ,); ,);
获得的表如图所示:(分别为Card、Book、Borrow三张表)
查询练习:
1、查询借过书并且尚未归还的学生的借书证号、借阅者姓名,并按借书证号降序排列。
SELECT `Card`.cno `借书证号`,cname `姓名` FROM `Card` LEFT JOIN `Borrow` ON `Card`.cno = `Borrow`.cno WHERE `return_date` IS NULL ORDER BY `借书证号` DESC 首先从Card、Borrow两个表中提取数据并进行cno相等的左连接,得到的结果 再筛选归还时间为NULL的记录,最后选取cno(设置别名为借书证号)和cname (设置别名为姓名)生成结果表,显示结果通过ORDER BY...ON...语句设置 为以借书证号倒序排列
1
2、查询哪个系的同学借书数量最多
SELECT department 系,COUNT(department) 借书册数 FROM `Card` JOIN `Borrow` ON `Card`.cno = `Borrow`.cno WHERE `type` = 'S' GROUP BY `department` HAVING COUNT(department) >= ALL(SELECT COUNT(department) FROM `Card` JOIN `Borrow` ON `Card`.cno = `Borrow`.cno WHERE `type` = 'S' GROUP BY `department`) 思路: 首先通过 SELECT COUNT(department) FROM `Card` JOIN `Borrow` ON `Card`.cno = `Borrow`.cno WHERE `type` = 'S' GROUP BY `department` 获得每个系的学生借书总量 然后用各个系的学生的借书总量和所有系的借书总量分别比较,可以找到那个系借书最多。
2
3、查询藏书中那些出版社的书籍超过350本
SELECT `press_totle`.出版社,`press_totle`.总量 FROM (SELECT `press` `出版社`,SUM(`book_totle`) 总量 FROM `Book` GROUP BY `press`) AS `press_totle` 思路: 首先获得每个出版社的藏书总量 SELECT `press` `出版社`,SUM(`book_totle`) 总量 FROM `Book` GROUP BY `press` 获得一个中间表命名为press_totle,然后使用这个中间表作建立查询,筛选总量在350以上的出版社。
3
以上三道题目对初学者来讲都是很好的练习题,主要通过题目来分析SQL语言的执行顺序,中间表的生成位置与能够调用中间表的位置都和SQL的执行有关。在SELECT子查询中出现的中间表不能在FROM中使用,因为FROM是先于SELECT执行的。
SQL查询语言和编程语言的设计思路有很大不同,首先是因为SQL查询语言的运行顺序和语法顺序不同,其次是应为SQL查询语言在设计思路和语法逻辑上更贴近自然语言,初学者如果抛弃程序语言的思路来学习SQL,才能事半功倍。但是也正因为SQL查询语言贴合自然语言思路的特点,数据库的查询语句才那么简单易用。