1、折线图
作用:适合于随时间变化的递增或递减变量,有规律可循,需要了解某变量在一段时间的趋势变化,就用折线图。
注意:折线图条数过多不宜放在一张图内
具体例子:公司的A商品的年销售趋势。
2、柱状图
作用:各类别之间的对比。
注意:垂直柱状图最多12个分类,横向柱状图最多30个分类。分类名过长,选用横向柱状图。
具体例子:每月降雨量
3、直方图
作用:查看各组数据数量分布的情况,用于观察异常或孤立数据。
具体例子:
注意:样本不少于50个。区别于柱状图(柱状图是查看每个类别的大小,而直方图则是查看各组数据数量分布的情况)。
4、散点图
作用:查看变量之间的相关性以及相关程度。
根据样本数据特征计算出回归方程。
具体例子:身高和体重的关系
5、饼状图
作用:显示分类之间的占比情况,分类个数不宜超过9个。
注意:占比接近的,不宜使用,可以使用柱状图。
具体例子:A城市少年、青年、壮年、中年、老年人的每月读书情况占比
6、箱线图
核心指标:四分位数。
将一组数据按从小到大顺序排列,等分为4份。
- 下四分位数:Q1=25%的数据处
- 上四分位数:Q3=75%的数据处
- 中位数:Q2
- IQR=Q3-Q1
- 下限值=Q1-1.5*IQR
- 上限值=Q3+1.5*IQR
注意:上限值不是最大值,下限值也不是最小值。
作用:
直观明了识别数据中的异常值;
判断数据的偏态:偏上说明整体水平在中上,区域跨度较大说明数据分布差异较大;
比较多组数据的分布情况。若只比较一组数据的分布情况,使用直方图。
具体例子:各城市的薪资分布情况