数据的对称、偏倚

常见的分布一般都只有一个(peak),称为单峰(unimode)分布。如果数据是单峰分布的,也意味着数据的众数(mode)只有一个,因为众数是数据的最大值。当数据表现为单峰分布,一般分布具有对称或偏倚的特征。

对称分布(symmetric distribution)

表现在直方图上,对称分布的左右两部分关于均值(mean)对称
数据的对称、偏倚
数据的对称、偏倚

分布的(tail)是从均值到左边和右边的部分,是直方图中计数变小的部分。对称分布的两个尾基本相等,即长度大致相同。

skew

右偏倚分布(skewed right),也称为正偏倚(positively skewed)。右偏倚的数据有一条向右延伸的长(右)尾。
数据的对称、偏倚

  • mean > median
  • mean > mode
  • median > mode
  • 右尾比左尾长

数据的对称、偏倚

  • mean比较靠近第一分位数,远离第三分位数
  • 右尾比左尾长

左偏倚分布(skewed left)和右偏分布正好相反。

  • mean < median
  • mean < mode
  • median < mode
  • 左尾比右尾长

数据的对称、偏倚

整理编译、图 via

上一篇:[LeetCode] 1471. The k Strongest Values in an Array


下一篇:【POJ3784】Running Median