行转列:sum+if
-
在长表的数据组织结构中,同一uid对应了多行,即每门课程一条记录,对应一组分数,而在宽表中需要将其变成同一uid下仅对应一行
-
在长表中,仅有一列记录了课程成绩,但在宽表中则每门课作为一列记录成绩
-
由多行变一行,那么直觉想到的就是要groupby聚合;由一列变多列,那么就涉及到衍生提取;
-
既然要用groupby聚合,那么就涉及到将多门课的成绩汇总,但现在需要的不是所有成绩汇总,而仍然是各门课的独立成绩,所以需要用一个if函数加以筛选提取;当然,用case when也可以;
-
在if筛选提取的基础上,针对不同课程设立不同的提取条件,并最终加一个聚合函数提取该列成绩即可。
======》》
SELECT uid,
sum(if(course=‘语文‘, score, NULL)) as `语文`,
sum(if(course=‘数学‘, score, NULL)) as `数学`,
sum(if(course=‘英语‘, score, NULL)) as `英语`,sum(if(course=‘物理‘, score, NULL)) as `物理`,
sum(if(course=‘化学‘, score, NULL)) as `化学`FROM scoreLong
GROUP BY uid
其中,if(course=‘语文‘, score, NULL)语句实现了当且仅当课程为语文时取值为课程成绩,否则取值为空,这相当于衍生了一个新的列字段,且对于每个uid而言,其所有成绩就只有特定课程的结果非空,其余均为空。
这样,无论使用任何聚合函数,都可以得到该uid下指定课程的成绩结果。这里是用了sum函数,其实用min、max效果也是一样的,因为待聚合的数值中就只有那一个值非空。
列转行:union
列转行是上述过程的逆过程,所以其思路也比较直观:
-
行记录由一行变为多行,列字段由多列变为单列;
-
一行变多行需要复制,列字段由多列变单列相当于是堆积的过程,其实也可以看做是复制;
-
一行变多行,那么复制的最直观实现当然是使用union,即分别针对每门课程提取一张衍生表,最后将所有课程的衍生表union到一起即可,其中需要注意字段的对齐
=======》》》》
SELECT uid, ‘语文‘ as course, `语文` as score
FROM scoreWide
WHERE `语文` IS NOT NULL
UNION
SELECT uid, ‘数学‘ as course, `数学` as score
FROM scoreWide
WHERE `数学` IS NOT NULL
UNION
SELECT uid, ‘英语‘ as course, `英语` as score
FROM scoreWide
WHERE `英语` IS NOT NULL
UNION
SELECT uid, ‘物理‘ as course, `物理` as score
FROM scoreWide
WHERE `物理` IS NOT NULL
UNION
SELECT uid, ‘化学‘ as course, `化学` as score
FROM scoreWide
WHERE `化学` IS NOT NULL
【在每个单门课的衍生表中,例如这句:SELECT uid, ‘语文‘ as course, `语文` as score,用单引号包裹起来的课程名称是字符串常量,比如语文课的衍生表中的课程名都叫语文,然后将该列命名为course;第二个用反引号包裹起来的课程名实际上是从宽表中引用这一列的取值,然后将其命名为score。】