五、表连接
当数据表中存在许多重复的冗余信息时,就要考虑将这些信息建在另一张新表中,在新表中为原表设置好外键,在进行数据查询的时候,就要使用到连接了,表连接就好像两根线,线的两端分别连接两张表的不同字段上,将两个字段进行关联。表连接分为内连接(inner join)、交叉连接、自连接和外连接等。
1、内连接,语法 inner join table_name on condition ,table_name被关联的表名,condition关联条件。
例如:有两张表,T_Customer保存着客户的Id,姓名,年龄等信息,T_Order表保存着订单号及订单价格等信息,T_Order中FCustomerId是T_Customer中的FId的外键,下面查询客户姓名为Mike的客户的订单号及订单价格。
select c.FName,o.FNumber,o.FPrice
from T_Order o
inner join T_Customer c on o.FCustomerId=c.FId
where c.FName='Mike'
2、交叉连接,与内连接相比,交叉连接非常简单,不需要on子句,交叉连接将表中的所有记录都包含到结果集中,交叉连接分为隐式的连接和显示的cross join 连接,其中隐式的交叉连接,所有数据库都支持,cross join显示的交叉连接DB2数据库不支持。例如:查询上两张表中客户的Id,姓名,年龄以及订单信息。
-- 隐式的交叉连接
select T_Customer.Id,T_Customer.FName,T_Customer.FAge,TOrder.FName,TOrder.FNumber
from T_Customer ,TOrder
-- 显示的交叉连接
select T_Customer.Id,T_Customer.FName,T_Customer.FAge,TOrder.FName,TOrder.FNumber
from T_Customer across join TOrder
3、自连接,其主要用途就是检索一张表中的内部情况,例如检索表T_Order中订单类型相同的订单的列表。
select o1.FNumber ,o1.FName,o1.FType, o2.FNumber ,o2.FName,o2.FType
from T_Order o1
inner join T_Order o2 on o1.FType=o2.FType and o1.FId <o2.FId
(至于为什么要加上and后面的约束及为什么不是 o1.FId <>o2.FId ,感兴趣的朋友我们可以自己试一试,因为存在着信息重复的问题,我们也可以继续交流)
4、外连接,内连接要求连接的两张表必须有匹配的记录,但是如果说T_Order表中的FCustomerId一列有null值,那么内连接是无法将这条信息查询出来的,但是我们是需要这条数据的,这样就需要外部连接了,外连接包括左外连接,右外连接和全外连接,全外连接在数据库MySql中是不支持的,所以,可以使用union all 联合两个查询语句,即左外连接查询和右外连接查询。
左外连接就是将左表中的所有数据,无论是否满足on后面的条件语句,都匹配出来。右外连接就是将右表中的所有数据,无论是否满足on后面的条件语句,都匹配出来。而全外连接,就是将两张表中的所有数据,无论是否满足on后面的条件语句,都匹配出来。
-- 左外连接,取出左表T_Customer中的所有数据,无论是否匹配 T_Customer.FId =T_Order.FCustomerId
select c.FNumber ,C.FName,o.FNumber ,o.FPrice
from T_Customer c
left outer join T_Order o on T_Customer.FId =T_Order.FCustomerId
-- 右外连接,取出右表T_Order中的所有数据,无论是否匹配 T_Customer.FId =T_Order.FCustomerId
select c.FNumber ,C.FName,o.FNumber ,o.FPrice
from T_Customer c
right outer join T_Order o on T_Customer.FId =T_Order.FCustomerId
-- 全外连接,取出两张表中的所有数据,无论是否匹配 T_Customer.FId =T_Order.FCustomerId
select c.FNumber ,C.FName,o.FNumber ,o.FPrice
from T_Customer c
full outer join T_Order o on T_Customer.FId =T_Order.FCustomerId
六、子查询
sql允许将一个查询语句作为结果集提供给其它sql语句使用,被当做结果集的查询语句就是子查询,可以将子查询看做是一张临时生成的数据表(此时的搜索结果必须是多行多列),这张数据表在开始时被创建,在查询结束时被删除。子查询可以用在select语句,insert语句以及update语句。子查询大大简化了sql语句的编写,提高了效率,但是如果使用不当,容易造成性能问题。
1、单值子查询
单值子查询和普通的sql语句没什么区别,唯一的限制就是子查询的返回值必须只有一行记录,而且只能有一个列,这样的子查询也称作标量子查询。
select 1 as f1 ,2 ,(select MIN (FYearOfPublish)from T_Book ) as N'最早出版年份',
(select MAX (FYearOfPublish) from T_Book )as N'最晚出版年份'
2、列值子查询
与标量子查询不同,列值子查询可以返回一个多行多列的结果集,又称为表子查询,可以看做一个临时的表。
--查询出版日期在1800年以前的书的名字及作者的名字,当然这个地方用到了交叉连接的隐式实现
select r.FName ,b.FName ,b.FYearOfPublish
from T_Reader r,(select FName ,FYearOfPublish from T_Book where FYearOfPublish <1800) b
3、select语句中的标量子查询
标量子查询唯一的限制就是子查询的返回值必须只有一行记录,而且只能有一个列,其实标量子查询完全可以返回随当前记录变化而变化的值。比如:
--返回每一类图书的最新出版年份,图书类别
select FId ,FName,
(
select MAX (FYearOfPublish)from T_Book b
where b.FCategoryId =c.FId )as N'最新出版年份'
from T_Categroy c
4、where语句中的标量子查询
标量子查询不仅可以用在select语句中,而且可以用在where语句中,比如:
--返回最喜欢读的书籍类别为Story的读者的ID信息
select FReaderId from T_ReaderFavorite
where FCategoryId =
(
select FId from T_Categroy
where FName ='Story'
)
再看一个综合点的例子:假设需要检索每一种书籍类别中出版年份最早的书籍的名称,如果有两本或两本以上的,则都显示他们的名字。要求检索结果中显示类型的名字、书的名字和它的出版年份。
select T_Categroy .FName ,T_Book .FName ,T_Book .FYearOfPublish
from T_Book inner join T_Categroy on T_Book .FCategoryId =T_Categroy .FId
where T_Book .FYearOfPublish =
(
select MIN (T_Book .FYearOfPublish) from T_Book
where T_Book .FCategoryId =T_Categroy .FId
)
当然上面的语句中也可以使用别名代换,这样会更简明些。
5、集合运算符与子查询,如果子查询的结果集是多行多列的,那么可以将该子查询看做是一个临时的数据表,但是当结果集是一个多行单列的集合时,就需要使用in,any,all及exists等来查询。
in操作符,是用来匹配多行单列的,可以简单的匹配一个集合中的某一项,比如检索在2001,2003,2005年出版的所有图书
select * from T_Book where FYearofPublish in (2001,2003,2005)
select * from T_Reader where FYearofJoin in (select FYearofPublis from T_Book)
any必须和其他的比较运算符(=,<,>,!=)共同使用,不严谨的说你可以这样认为,any就是任何一个,匹配任何一个的意思,比如
select * from T_Reader where FYearOfJoin =any ( select FYearOfPublish from T_Book )
select * from T_Reader where FYearOfJoin <>any ( select FYearOfPublish from T_Book )
这两条语句前一条=any其效果适合in一样的,<>any 效果适合not in 一样的,除了=运算符,any还可以和大于小于大于等于等运算符共同使用,例如:
-- 查询在所有会员出生之前出版的书
select * from T_Book where FYearOfPublish <any( select FYearOfBith from T_Reader)
exists,是否存在比较运算符,其后面的语句如果为真则返回true,否则返回false。先看一个例子:
在这个事例中,如果T_Reader表中存在姓名为Tom的读者信息,那么将返回T_Book表中的信息,反之,不会检索出任何信息。也就是,如果存在,则返回,不存在,则查不到任何信息,看似好像exists的作用并不是很大,但是它往往用在子查询中引用外部字段的检索中,看实例:
-- 检索1950年以前出版的图书的图书类别
select * from T_Category where exists (select * from T_Book where T_Book.FCategoryId =T_Category.Id and T_Book .FYearofPublis <1950 )
这样就会检索出在1950年以前出版的图书的信息了。
七、子查询在insert语句update语句中的应用
insert语句:一般的,向一个数据表中添加一条数据就是应用insert into 表名(字段1,字段2……)values (值1,值2,……) 比如
insert into T_Person(FId ,FName,FAge) values (1,'Tom',20)
但其实insert还有另外一种用法,就是insert ……select……语句,具体语法为insert into 表名(字段1,字段2……)select (值1,值2,……) from 表
insert into T_Reader2(FId,FName,FAge) select (FId,FName,FAge) from T_Reader
这条语句其实就相当于复制了一个T_Reader表,将其信息插入到了T_Reader2 中。当然,insert……select 还有更复杂的用法,可以向不同结构的表中插入数据,例如:为每个读者的爱好增加“小说”,也就是为每一个读者在其T_ReaderFavorite中添加一条FCategory=1的记录(如果原先读者已经有了此爱好,就不用添加,如果没有此爱好,就添加)。
insert into T_ReaderFavorite(FCategoryId ,FReaderId ) select 1,FId from T_Reader
where not exists
(
select * from T_ReaderFavorite where T_ReaderFavorite .FCategoryId =1 and T_ReaderFavorite .FReaderId =T_Reader .FId
)
update语句:在update语句中子查询也可以有比较复杂的检索,例如:将所有同类图书的本数超过3本的图书的出版日期更新为2008(自连接)
update T_Book set FYearOfPublish =2008 where (select COUNT (*) from T_Book bk2 where bk2 .FCategoryId =T_Book .FCategoryId )>3
delete语句:例如:将所有同类图书的本数超过3本的图书删除
delete from T_Book where (select count(*) from T_Book bk where bk.FCategoryId=T_Book.FCategoryId)>3