【题目】
“满意度表”记录了教师和学生对课程的满意程度。“是否满意”列里是老师和学生对课程的评价,其中“是”表示教师和学生都满意。
“ 用户表”记录了学校教师和学生的信息。每个用户有唯一键 “编号”,“是否在系统”表示这个用户是否还在这所学校里,“角色”表示这个人是学生还是教师。
两个表的关系:满意度表的“学生编号” 、 “教师编号” 和用户表的 “编号” 联结。
现在需要分析出学校里人员对课程的满意度。满意度的计算方式如下:
(教师和学生对课程都满意且已存在当前教务系统中的用户) / (在学校里的人数)
【解题思路】
1.多表联结
统计满意度的前提是需要用户在学校里,需要用到“用户表”里的“是否在系统”来判断。满意度需要用到“满意度表”。所以涉及到两个表里的数据,就要用到《猴子 从零学会sql》里讲过的多表联结。
那么,使用哪种联结呢?
统计值为满意度,所以使用“满意度表”为主表,进行左联结。
from 满意度表
left join 用户表;
如何联结呢?
两个表的关系:满意度表的“学生编号” 、 “教师编号” 和用户表的 “编号” 联结。所以联结条件是:
满意度表.教师编号 = 用户表.编号 or 满意度表.学生编号 = 用户表.编号
基于上面的分析,多表联结查询sql语句如下:
from 满意度表
left join 用户表
on (满意度表.教师编号 = 用户表.编号 or
满意度表.学生编号 = 用户表.编号);
2.查询条件
满意度等于:
(教师和学生对课程都满意且已存在当前教务系统中的用户) / (在学校里的人数)
由这个公式可以知道,分子和分母计算的前提都是存在学校里的用户。所以,查询条件是:用户表中存在学校里的用户。
把条件子句加入前面的多表查询sql里,就是下面的sql:
from 满意度表
left join 用户表
on (满意度表.教师编号 = 用户表.编号 or 满意度表.学生编号 = 用户表.编号)
where 用户表.是否在系统 = '是';
上面sql运行结果如下,我们发现,教师编号“02”不在学校里(对应的列“是否在系统”里的值是“否”),这是怎么回事呢?
我们重新梳理一遍逻辑。
目前的逻辑是:(教师编号 = 编号 或 学生编号 = 编号) 且 编号在学校中。这等价于:
(教师编号 = 编号 且 编号在学校中) 或(学生编号 = 编号,且 编号在学校中)
这里的“或”逻辑会将范围扩大,所以且不在学校的“02”号教师也会出现在查询结果中。
正确的做法是先从表中分别选出“在学校”里的学生和教师,然后再多表联结。也就是:
(教师编号 = 编号 且 该编号在系统中 )并且
(学生编号 = 编号 且 该编号在系统中)
对应的sql如下:
from 满意度表
left join(select 编号 from 用户表 where 是否在系统='是') as 学生
on (满意度表.学生编号 = 学生.编号)
left join(select 编号 from 用户表 where 是否在系统='是') as 教师
on (满意度表.教师编号 = 教师.编号);
3.统计
满意度等于:
(教师和学生对课程都满意且已存在当前教务系统中的用户) / (在学校里的人数)
我把这个公示简化为:满意度=a/b
其实a=教师和学生对课程都满意且已存在当前教务系统中的用户
b=在学校里的人数
我们只需要把a和b的值计算出来就可以啦。
1)计算a
统计好“是否满意”列里有多少个值为“是”。
我们可以把“是”转化成1,然后累计求和,对应的sql就是:
else 0
end)
2)计算b
b=在学校里的人数,直接用计数函数(count)就可以:count(是否满意)
3)计算出满意度
满意度=a/b,也就是
as 满意度
把这个计算公示加入前面sql语句的查询结果里就是(下面的select子句):
from 满意度表
left join(select 编号 from 用户表 where 是否在系统='是') as 学生
on (满意度表.学生编号 = 学生.编号)
left join(select 编号 from 用户表 where 是否在系统='是') as 教师
on (满意度表.教师编号 = 教师.编号);
最后的查询结果是满意度=0.75。
【本题考点】
● 考察多表查询的应用
● 如何将业务需求转换为sql语句的能力
● 聚合函数的运用
【举一反三】
下表是一家出行公司(比如滴滴、Uber)的数据库表。乘客通过该公司的app叫车,司机通过app接收订单。
Users 表里存放的是用户信息。每个用户有唯一值(Users_Id) 。Banned 表示用户是否因为违规被禁止使用app。Role 记录了用户的角色,里面的值driver是司机,client是乘客,partner是合伙人。
Trips 表记录了各个出租车的行程信息。每段行程有唯一键(Id) 。Status 行程类型 ‘completed’表行程正常结束, ‘cancelled_by_driver’ 表示行程因为司机原因取消,‘cancelled_by_client’表示行程因为乘客原因取消。
两个表的联结关系:Trips 表(Client_Id 、 Driver_Id) 和 Users 表中 Users_Id 的联结。
写一段 SQL 语句查出非禁止用户的取消率。
取消率的计算方式如下:(被司机或乘客取消的非禁止用户生成的订单数量) / (非禁止用户生成的订单总数)
参考答案:
1.多表联结,找出非禁止的用户
from trips
left join (select users_id from users where banned = 'no') as client
on (trips.Client_Id = client.users_id)
left join (select users_id from users where banned = 'no') as driver
on (trips.Driver_Id = driver.users_id);
2.按日期分组
因为要计算的是“每天”的取消率,所以要按日期分组,统计每一天的。
group by trips.request_at
3.计算取消率
被司机或乘客取消的非禁止用户生成的订单数量=
sum(case when status = 'completed' then 1 else 0 end)
非禁止用户生成的订单总数=count(status)
最终sql如下:
from trips
left join (select users_id from users where banned = 'no') as client
on (trips.Client_Id = client.users_id)
left join (select users_id from users where banned = 'no') as driver
on (trips.Driver_Id = driver.users_id);
group by trips.request_at;