概率论 —— 随机变量的数字特征

文章目录

一、一维随机变量的数字特征

1. 数学期望

(1)概念定义

  • 如果 X X X 是离散型随机变量,其分布列为 p i = P { X = x i } ( i = 1 , 2 , . . . ) p_i = P\{X=x_i\}(i=1,2,...) pi​=P{X=xi​}(i=1,2,...), Y Y Y 是 X X X 的函数, Y = g ( X ) Y = g(X) Y=g(X)

    • 若级数 ∑ i = 1 ∞ x i p i \sum\limits_{i=1}^\infin x_ip_i i=1∑∞​xi​pi​绝对收敛,则称随机变量 X X X 的数学期望存在,并将级数和 ∑ i = 1 ∞ x i p i \sum\limits_{i=1}^\infin x_ip_i i=1∑∞​xi​pi​ 称为随机变量的数学期望,记为 E ( X ) 或 E X E(X) 或 EX E(X)或EX,即 E ( X ) = ∑ i = 1 ∞ x i p i E(X) = \sum\limits_{i=1}^\infin x_ip_i E(X)=i=1∑∞​xi​pi​ 否则称 X X X 的数学期望不存在;
    • 若级数 ∑ i = 1 ∞ g ( x i ) p i \sum\limits_{i=1}^\infin g(x_i)p_i i=1∑∞​g(xi​)pi​ 绝对收敛,则称 Y = g ( x ) Y = g(x) Y=g(x) 的数学期望 E [ g ( X ) ] E[g(X)] E[g(X)] 存在,且 E [ g ( X ) ] = ∑ i = 1 ∞ g ( x i ) p i E[g(X)] = \sum\limits_{i=1}^\infin g(x_i)p_i E[g(X)]=i=1∑∞​g(xi​)pi​,否则称 g ( X ) g(X) g(X) 的数学期望不存在
  • 如果 X X X 是连续型随机变量,其概率密度为 f ( x ) f(x) f(x), Y Y Y 是 X X X 的函数, Y = g ( X ) Y = g(X) Y=g(X)

    • 若积分 ∫ − ∞ + ∞ x f ( x ) d x \int_{-\infin}^{+\infin} xf(x)dx ∫−∞+∞​xf(x)dx 绝对收敛,则称 X X X 的数学期望存在,且 E X = ∫ − ∞ + ∞ x f ( x ) d x EX=\int_{-\infin}^{+\infin} xf(x)dx EX=∫−∞+∞​xf(x)dx,否则称 X X X 的数学期望不存在。

    • 若积分 ∫ − ∞ + ∞ g ( x ) f ( x ) d x \int_{-\infin}^{+\infin} g(x)f(x)dx ∫−∞+∞​g(x)f(x)dx 绝对收敛,则称 g ( X ) g(X) g(X) 的数学期望存在,且 E [ g ( X ) ] = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E[g(X)]=\int_{-\infin}^{+\infin} g(x)f(x)dx E[g(X)]=∫−∞+∞​g(x)f(x)dx,否则称 g ( X ) g(X) g(X) 的数学期望不存在。

(2)说明

  • 数学期望又称为概率平均值,常常简称 期望均值数学期望是描述随机变量平均取值状况特征的指标,它刻画随机变量的一切可能值的集中位置
  • 在数学期望的定义中要求级数(或积分)绝对收敛,否则称期望不存在。这是因为 X X X 的期望存在要求与 X X X 的取值顺序无关,即要求任意改变 x i x_i xi​ 的次序不应改变 E X EX EX 的存在性,这在数学上就要求级数(或积分)绝对收敛,况且绝对收敛又有很多性质也便于数学上的处理。

(3)性质

  1. 对任意常数 a a a 和随机变量 X i ( i = 1 , 2 , . . . , n ) X_i(i=1,2,...,n) Xi​(i=1,2,...,n) 有 E ( ∑ i = 1 n a i X i ) = ∑ i = 1 n a i E X i E(\sum \limits_{i=1}^na_iX_i) = \sum \limits_{i=1}^na_i EX_i E(i=1∑n​ai​Xi​)=i=1∑n​ai​EXi​

    1. E c = c Ec = c Ec=c
    2. E ( a X + c ) = a E X + c E(aX+c) = aEX+c E(aX+c)=aEX+c
    3. E ( X ± Y ) = E X ± Y E(X\pm Y) = EX \pm Y E(X±Y)=EX±Y
  2. 设 X X X 与 Y Y Y 相互独立,则

    1. E ( X Y ) = E X ⋅ E Y E(XY) = EX ·EY E(XY)=EX⋅EY
    2. E [ g 1 ( X ) ⋅ g 2 ( Y ) ] = E [ g 1 ( X ) ] ⋅ E [ g 2 ( Y ) ] E[g_1(X) · g_2(Y)] = E[g_1(X)] · E[g_2(Y)] E[g1​(X)⋅g2​(Y)]=E[g1​(X)]⋅E[g2​(Y)]
  3. 一般地,设 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1​,X2​,...,Xn​ 相互独立,则

    1. E ( ∏ i = 1 n X i ) = ∏ i = 1 n E X i E(\prod\limits_{i=1}^nX_i) = \prod\limits_{i=1}^n EX_i E(i=1∏n​Xi​)=i=1∏n​EXi​
    2. E [ ∏ i = 1 n g i ( X i ) ] = ∏ i = 1 n E [ g i ( X i ) ] E[\prod\limits_{i=1}^n g_i(X_i)] = \prod\limits_{i=1}^n E[g_i(X_i)] E[i=1∏n​gi​(Xi​)]=i=1∏n​E[gi​(Xi​)]

2. 方差、标准差

(1)概念

  1. 方差:设 X X X 是随机变量,如果 E [ ( X − E X ) 2 ] E[(X-EX)^2] E[(X−EX)2] 存在,则称 E [ ( X − E X ) 2 ] E[(X-EX)^2] E[(X−EX)2] 为 X X X 的方差,记为 D X DX DX,即

    ​ D X = E [ ( X − E X ) 2 ] = E ( X 2 ) − ( E X ) 2 DX = E[(X-EX)^2] = E(X^2)-(EX)^2 DX=E[(X−EX)2]=E(X2)−(EX)2

  2. 标准差:称 D X \sqrt{DX} DX ​ 为 X X X 的标准差或方差,记为 σ ( X ) \sigma(X) σ(X)

  3. 标准化随机变量:称随机变量 X ∗ = X − E X D X X^* = \frac{X-EX}{\sqrt{DX}} X∗=DX ​X−EX​ 为 X X X 的标准化随机变量,有 E X ∗ = 0 , D X ∗ = 1 EX^* = 0,DX^*=1 EX∗=0,DX∗=1

(2)性质

  1. D X ≥ 0 , E ( X 2 ) = D X + ( E X ) 2 ≥ ( E X ) 2 DX \geq 0,E(X^2) = DX+(EX)^2 \geq (EX)^2 DX≥0,E(X2)=DX+(EX)2≥(EX)2
  2. D c = 0 Dc=0 Dc=0 (c为常数)
  3. D ( a X + b ) = a 2 D X D(aX+b) = a^2DX D(aX+b)=a2DX
  4. D ( X ± Y ) = D X + D Y + 2 C o v ( X , Y ) D(X \pm Y) = DX+DY+2Cov(X,Y) D(X±Y)=DX+DY+2Cov(X,Y)
  5. 若 X X X 和 Y Y Y 相互独立,则
    ​ D ( a X + b Y ) = a 2 D X + b 2 D Y D(aX+bY) = a^2DX + b^2DY D(aX+bY)=a2DX+b2DY
    一般地,如果 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1​,X2​,...,Xn​ 相互独立, g i ( x ) g_i(x) gi​(x) 为 x x x 的连续函数,则
    ​ D ( ∑ i = 1 n a i X i ) = ∑ i = 1 n a i 2 D X i ​ D [ ∑ i = 1 n g i ( X i ) ] = ∑ i = 1 n D [ g i ( X i ) ] D(\sum\limits_{i=1}^n a_iX_i) = \sum\limits_{i=1}^n a_i^2DX_i \\ ​ D[\sum\limits_{i=1}^n g_i(X_i)] = \sum\limits_{i=1}^n D[g_i(X_i)] D(i=1∑n​ai​Xi​)=i=1∑n​ai2​DXi​​D[i=1∑n​gi​(Xi​)]=i=1∑n​D[gi​(Xi​)]

3. 切比雪夫不等式

  • 如果随机变量 X X X 的方差 D X DX DX 存在,则对任意 ϵ > 0 \epsilon>0 ϵ>0,有

    ​ P { ∣ X − E X ∣ ≥ ϵ } ≤ D X ϵ 2 P\{|X-EX|\geq\epsilon\} \leq \frac{DX}{\epsilon^2} P{∣X−EX∣≥ϵ}≤ϵ2DX​

  • 由切比雪夫不等式知,当 D X DX DX 愈小时,概率 P { ∣ X − E X ∣ < ϵ } P\{|X-EX|<\epsilon\} P{∣X−EX∣<ϵ} 越大,这表明方差是刻画随机变量与其期望值偏离程度的量,是描述随机变量 X X X “分散程度” 特征的指标

  • 常用分布的期望和方差
    概率论 —— 随机变量的数字特征

二、二维随机变量的数字特征

1. 数学期望

  • 设 X , Y X,Y X,Y 为随机变量, g ( X , Y ) g(X,Y) g(X,Y) 为 X , Y X,Y X,Y 的函数
  • 如果 ( X , Y ) (X,Y) (X,Y) 为离散型随机变量,其联合分布为
    ​ p i j = P { X = x i , Y = y i } ( i , j = 1 , 2 , . . . ) p_{ij} = P\{X = x_i,Y=y_i\}(i,j=1,2,...) pij​=P{X=xi​,Y=yi​}(i,j=1,2,...)
    ​ 若级数 ∑ i ∑ j g ( x i , y i ) p i j \sum\limits_{i}\sum\limits_{j}g(x_i,y_i)p_{ij} i∑​j∑​g(xi​,yi​)pij​ 绝对收敛,则定义
    ​ E [ g ( X , Y ) ] = ∑ i ∑ j g ( x i , y i ) p i j E[g(X,Y)] = \sum\limits_{i}\sum\limits_{j}g(x_i,y_i)p_{ij} E[g(X,Y)]=i∑​j∑​g(xi​,yi​)pij​
  • 如果 ( X , Y ) (X,Y) (X,Y) 为连续型随机变量,其概率密度为 f ( x , y ) f(x,y) f(x,y),若积分 ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y \int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin} g(x,y)f(x,y)dxdy ∫−∞+∞​∫−∞+∞​g(x,y)f(x,y)dxdy 绝对收敛,则定义
    ​ E [ g ( X , Y ) ] = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y E[g(X,Y)] = \int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin} g(x,y)f(x,y)dxdy E[g(X,Y)]=∫−∞+∞​∫−∞+∞​g(x,y)f(x,y)dxdy

2. 协方差与相关系数

(1)概念

  • 如果随机变量 X X X 与 Y Y Y 的方差存在且 D x > 0 , D Y > 0 Dx > 0,DY>0 Dx>0,DY>0,则称 E [ ( X − E X ) ( Y − E Y ) ] E[(X-EX)(Y-EY)] E[(X−EX)(Y−EY)] 为随机变量 X X X 与 Y Y Y 的 协方差,记为 C o v ( X , Y ) Cov(X,Y) Cov(X,Y),即
    ​ C o v ( X , Y ) = E [ ( X − E X ) ( Y − E Y ) ] = E ( X Y ) − E X ⋅ E Y Cov(X,Y) = E[(X-EX)(Y-EY)]=E(XY)-EX · EY Cov(X,Y)=E[(X−EX)(Y−EY)]=E(XY)−EX⋅EY
    其中

    ​ E ( X Y ) = { ∑ i ∑ j x i y j P ( X = x i , Y = y j ) ( 离 散 型 ) , ∫ − ∞ + ∞ ∫ − ∞ + ∞ x y f ( x , y ) d x d y ( 连 续 型 ) E(XY)=\left\{\begin{aligned} &\sum\limits_{i}\sum\limits_{j} x_iy_jP(X=x_i,Y=y_j) (离散型), \\ &\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}xyf(x,y)dxdy (连续型) \end{aligned} \right. E(XY)=⎩⎪⎪⎪⎨⎪⎪⎪⎧​​i∑​j∑​xi​yj​P(X=xi​,Y=yj​)(离散型),∫−∞+∞​∫−∞+∞​xyf(x,y)dxdy(连续型)​

    称 ρ X Y = C o v ( X , Y ) D X D Y \rho_{XY} = \frac{Cov(X,Y)}{\sqrt{DX}\sqrt{DY}} ρXY​=DX ​DY ​Cov(X,Y)​ 为随机变量 X X X 与 Y Y Y 的 相关系数,若为0则称 X X X 与 Y Y Y 不相关;否则称相关

  • 说明

    • 协方差 C o v ( X , Y ) Cov(X,Y) Cov(X,Y) 描述随机变量 X X X 和 Y Y Y 间关联程度,比如研究父亲身高 X X X 与孩子身高之间的偏 Y Y Y 的偏差程度,便可用 C o v ( X , Y Cov(X,Y Cov(X,Y) 来刻画
    • 相关系数 ρ X Y \rho_{XY} ρXY​ 描述随机变量 X X X 和 Y Y Y 之间的线性相依性, ∣ ρ X Y ∣ |\rho_{XY}| ∣ρXY​∣ 的大小是刻画 X X X 和 Y Y Y 之间的线性相关程度的一种度量。 ρ X Y = 0 \rho_{XY}=0 ρXY​=0 表示 X X X 和 Y Y Y 之间不存在线性关系,故称 X X X 和 Y Y Y 不线性相关,但这并不意味着 X X X 和 Y Y Y 之间不存在相依关系,它们之间还可存在某种非线性关系。

(2) 性质

  • 协方差相关性质
    概率论 —— 随机变量的数字特征

三、独立性与相关性的判定

概率论 —— 随机变量的数字特征

上一篇:ACM-ICPC寒假算法训练1:搜索 HDOJ P1010 : Tempter of the Bone 奇偶剪枝分析


下一篇:2021算法设计与编程挑战赛 (春季赛)-F题