描述
题目:现在运营想要对每个学校不同性别的用户活跃情况和发帖数量进行分析,请分别计算出每个学校每种性别的用户数、30天内平均活跃天数和平均发帖数量。
用户信息表:user_profile
30天内活跃天数字段(active_days_within_30)
发帖数量字段(question_cnt)
回答数量字段(answer_cnt)
第一行表示:id为1的用户的常用信息为使用的设备id为2138,性别为男,年龄21岁,北京大学,gpa为3.4在过去的30天里面活跃了7天,发帖数量为2,回答数量为12
。。。
最后一行表示:id为7的用户的常用信息为使用的设备id为4321,性别为男,年龄26岁,复旦大学,gpa为3.6在过去的30天里面活跃了9天,发帖数量为6,回答数量为52
你的查询返回结果需要对性别和学校分组,示例如下,结果保留1位小数,1位小数之后的四舍五入:
解释:
第一行表示:北京大学的男性用户个数为1,平均活跃天数为7天,平均发帖量为2
。。。
最后一行表示:山东大学的男性用户个数为2,平均活跃天数为17.5天,平均发帖量为11
我的答案:
select
gender,university,
count(*) as user_num,
avg(active_days_within_30) as avg_avtive_days,
avg(question_cnt) as avg_question_cnt
from user_profile
group by gender,university
注意:group by 的属性顺序与结果无关,也就是这里的gender和university可以互换,结果不变,结果顺序也不变。
题意明确:
每个学校每种性别的用户数、30天内平均活跃天数和平均发帖数量
问题分解:
- 限定条件:无;
- 每个学校每种性别:按学校和性别分组:
group by gender, university
- 用户数:count(device_id)
- 30天内平均活跃天数:avg(active_days_within_30)
- 平均发帖数量:avg(question_cnt)
细节问题:
- 表头重命名:as
- 注意输出顺序,与示例保持一致
完整代码:
1 2 3 4 5 6 7 |
|