散点图主要观察两组变量间的趋势和分布,如果变量多于两组,仍旧使用散点图的话,那所有点都
会集中在同一显示区域内,使人无法准确判断,此时一般使用散点图矩阵进行两两比较。
除此之外,如果并不关心组与组之间的关系,而重点想观察单组变量的话,可以使用分组散点图,
现在举例说明:
原始数据如下:
在每组数据前添加辅助列,辅助列的公式为
辅助1:=0.9+RAND()/5
辅助2:=1.9+RAND()/5
辅助3:=2.9+RAND()/5
辅助4:=3.9+RAND()/5
辅助列的作用是将数据在图中分组,而不至于所有点都混在一起,rand()/5的意思是使每个数据的
横轴有所区别,但是又不能太分散,如果辅助列设为不变数,也可以实现数据分组,但是数据点必
定都在一条直线上,重叠度较大。
计算每组数据的均值和标准差,此时的辅助列要为固定值,因为想要这三个值保持在一条直线上。
先使用辅助1和序列1做散点图,然后将2,3,4分别加进去,最后再加均值和标准差的部分,辅助列统
一设为x轴,结果如下
最后就是调整一下显示格式
由此,我们可以看出每组数据的集中和离散,以及离群值等信息,当然还可以加入更多描述性统计量进行比较。