概率论与数理统计(4):随机变量的数字特征
文章目录
一.数学期望
引例:
频率与概率
设对某一随机现象进行了n次试验与观察,其中A事件出现了m次,即其出现的频率为m/n。经过大量反复试验,常有m/n越来越接近于某个确定的常数(此论断证明详见伯努利大数定律)。该常数即为事件A出现的概率,常用P (A) 表示。
1.离散型随机变量
①定义
设离散型随机变量X的分布列 P { X = x k } = p k , k = 1 , 2 , . . . P\{X=x_k\}=p_k,\qquad k=1,2,... P{X=xk}=pk,k=1,2,...
若级数
∑
k
=
1
∞
x
k
p
k
\sum\limits_{k=1}^{\infty}x_kp_k
k=1∑∞xkpk绝对收敛,则称级数
∑
k
=
1
∞
x
k
p
k
\sum\limits_{k=1}^{\infty}x_kp_k
k=1∑∞xkpk为X的数学期望(简称期望)或均值,记为E(X) or EX,即
E
(
X
)
=
∫
−
∞
∞
x
f
(
x
)
d
x
E(X)=\int^{\infty}_{-\infty}xf(x)dx
E(X)=∫−∞∞xf(x)dx
数学期望 E ( X ) E(X) E(X)完全由随机变量 X X X的概率分布所确定,若 X X X服从某一分布,也称 E ( X ) E(X) E(X)是这一分布的数学期望
②常见期望
分布类型 | 符号表示 | 数学期望 |
---|---|---|
两点分布 | X ∼ B ( 1 , p ) X\sim B(1,p) X∼B(1,p) | E X = p EX=p EX=p |
二项分布 | X ∼ B ( n , p ) X\sim B(n,p) X∼B(n,p) | E X = n p EX=np EX=np |
泊松分布 | X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ) | E X = λ EX=\lambda EX=λ |
证明:
两点分布
设 X X X的分布列为 P { X = 1 } = p , P { X = 0 } = 1 − p = q P\{X=1\}=p,P\{X=0\}=1-p=q P{X=1}=p,P{X=0}=1−p=q,则 E X = 0 ⋅ ( 1 − p ) + 1 ⋅ p = p EX=0\cdot(1-p)+1\cdot p=p EX=0⋅(1−p)+1⋅p=p
二项分布
设
X
∼
B
(
n
,
p
)
,
X\sim B(n,p),
X∼B(n,p),即
X
X
X的分布列为
P
{
X
=
k
}
=
C
n
k
p
k
q
n
−
k
,
k
=
0
,
1
,
⋯
,
n
,
0
<
p
<
1
,
q
=
1
−
p
P\{X=k\}=C_n^kp^kq^{n-k},k=0,1,\cdots,n,0<p<1,q=1-p
P{X=k}=Cnkpkqn−k,k=0,1,⋯,n,0<p<1,q=1−p,则:
E
X
=
∑
k
=
0
n
k
C
n
k
p
k
q
n
−
k
=
∑
k
=
1
n
n
!
p
k
q
n
−
k
(
k
−
1
)
!
(
n
−
k
)
!
=
n
p
∑
k
=
1
n
(
n
−
1
)
!
(
k
−
1
)
!
(
n
−
k
)
!
p
k
−
1
q
n
−
k
=
令
m
=
k
−
1
n
p
∑
m
=
0
n
−
1
C
n
−
1
m
p
m
q
n
−
1
−
m
=
n
p
EX=\sum_{k=0}^nkC_n^kp^kq^{n-k}=\sum_{k=1}^n\dfrac{n!p^kq^{n-k}}{(k-1)!(n-k)!}=np\sum_{k=1}^n\dfrac{(n-1)!}{(k-1)!(n-k)!}p^{k-1}q^{n-k}\xlongequal{令m=k-1}np\sum_{m=0}^{n-1}C_{n-1}^mp^mq^{n-1-m}=np
EX=k=0∑nkCnkpkqn−k=k=1∑n(k−1)!(n−k)!n!pkqn−k=npk=1∑n(k−1)!(n−k)!(n−1)!pk−1qn−k令m=k−1
npm=0∑n−1Cn−1mpmqn−1−m=np
泊松分布
设
X
∼
P
(
λ
)
X\sim P(\lambda)
X∼P(λ),即
X
X
X的分布列为
P
{
X
=
k
}
=
λ
k
k
!
e
−
λ
,
k
=
0
,
1
,
2
,
⋯
,
λ
>
0
P\{X=k\}=\dfrac{\lambda^k}{k!}e^{-\lambda},k=0,1,2,\cdots, \quad \lambda>0
P{X=k}=k!λke−λ,k=0,1,2,⋯,λ>0,则
E
X
=
∑
k
=
1
∞
k
λ
k
k
!
e
−
λ
=
λ
e
−
λ
∑
k
=
1
∞
λ
k
−
1
(
k
−
1
)
!
=
λ
e
−
λ
(
1
+
λ
+
1
2
!
λ
2
+
⋯
+
1
n
!
λ
n
+
⋯
)
=
λ
e
−
λ
e
λ
=
λ
EX=\sum_{k=1}^{\infty} k\dfrac{\lambda^k}{k!}e^{-\lambda}=\lambda e^{-\lambda}\sum_{k=1}^{\infty}\dfrac{\lambda^{k-1}}{(k-1)!}=\lambda e^{-\lambda}(1+\lambda+\dfrac{1}{2!}\lambda^2+\cdots+\dfrac{1}{n!}\lambda^n+\cdots)=\lambda e^{-\lambda}e^{\lambda}=\lambda
EX=k=1∑∞kk!λke−λ=λe−λk=1∑∞(k−1)!λk−1=λe−λ(1+λ+2!1λ2+⋯+n!1λn+⋯)=λe−λeλ=λ
③离散型随机变量函数的数学期望
(1)一维
设离散型随机变量X的分布列为 P { X = x k } = p k , k = 1 , 2 , . . . P\{X=x_k\}=p_k,\qquad k=1,2,... P{X=xk}=pk,k=1,2,..., Y = g ( X ) Y=g(X) Y=g(X),则:
E Y = E g ( X ) = ∑ i g ( x i ) p i EY=Eg(X)=\sum\limits_{i}g(x_i)p_i EY=Eg(X)=i∑g(xi)pi
(2)二维
设二维离散型随机变量 ( X , Y ) (X,Y) (X,Y)的分布列为 P { X = x i , Y = y i } = p i j , i , j = 1 , 2 , . . . P\{X=x_i,Y=y_i\}=p_{ij},i,j=1,2,... P{X=xi,Y=yi}=pij,i,j=1,2,..., Z = g ( X , Y ) , Z=g(X,Y), Z=g(X,Y),则 E Z = E g ( X , Y ) = ∑ i ∑ j g ( x i , y j ) p i j EZ=Eg(X,Y)=\sum\limits_{i}\sum\limits_{j}g(x_i,y_j)p_{ij} EZ=Eg(X,Y)=i∑j∑g(xi,yj)pij
2.连续型随机变量
①定义
设连续型随机变量
X
X
X的概率密度为
f
(
x
)
f(x)
f(x),若积分
∫
−
∞
+
∞
x
f
(
x
)
d
x
\int^{+\infty}_{-\infty}xf(x)dx
∫−∞+∞xf(x)dx绝对收敛,则称积分
∫
−
∞
+
∞
x
f
(
x
)
d
x
\int^{+\infty}_{-\infty}xf(x)dx
∫−∞+∞xf(x)dx的值为随机变量
X
X
X的数学期望,记为
E
(
X
)
E(X)
E(X),即
E
(
X
)
=
∫
−
∞
∞
x
f
(
x
)
d
x
E(X)=\int^{\infty}_{-\infty}xf(x)dx
E(X)=∫−∞∞xf(x)dx
②常见期望
分布类型 | 符号表示 | 数学期望 |
---|---|---|
均匀分布 | X ∼ U [ a , b ] X\sim U[a,b] X∼U[a,b] | E X = a + b 2 EX=\dfrac{a+b}{2} EX=2a+b |
指数分布 | X ∼ E ( β ) X\sim E(\beta) X∼E(β) | E X = 1 β EX=\dfrac{1}{\beta} EX=β1 |
正态分布 | X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2) | E X = μ EX=\mu EX=μ |
证明:
均匀分布
设
X
∼
U
[
a
,
b
]
X\sim U[a,b]
X∼U[a,b],即
X
X
X的概率密度为:
f
(
x
)
=
{
1
b
−
a
,
a
≤
x
≤
b
0
,
o
t
h
e
r
w
i
s
e
f(x)=\left\{ \begin{array}{lr}\frac{1}{b-a},\quad a\leq x\leq b \\ 0,\qquad otherwise \end{array} \right.
f(x)={b−a1,a≤x≤b0,otherwise
则
E
X
=
∫
−
∞
∞
x
f
(
x
)
d
x
=
∫
b
a
x
b
−
a
d
x
=
a
+
b
2
EX=\int^{\infty}_{-\infty}xf(x)dx=\int^a_b\dfrac{x}{b-a}dx=\dfrac{a+b}{2}
EX=∫−∞∞xf(x)dx=∫bab−axdx=2a+b
指数分布
设
X
∼
E
(
β
)
X\sim E(\beta)
X∼E(β),即
X
X
X的概率密度为:
f
(
x
)
=
{
0
,
x
⩽
0
β
e
−
β
x
,
x
>
0
f(x)= \left\{\begin{array}{lr} 0,\qquad \qquad x\leqslant0\\ \beta e^{-\beta x},\qquad x>0 \end{array} \right.
f(x)={0,x⩽0βe−βx,x>0
则
E
X
=
∫
−
∞
∞
x
f
(
x
)
d
x
=
−
∫
0
∞
x
d
(
e
−
β
x
)
=
−
x
e
−
β
x
∣
0
+
∞
+
∫
0
∞
e
−
β
x
d
x
=
1
β
EX=\int^{\infty}_{-\infty}xf(x)dx=-\int^{\infty}_{0}xd(e^{-\beta x})=-xe^{-\beta x}\bigg|^{+\infty}_0+\int^{\infty}_{0}e^{-\beta x}dx=\dfrac{1}{\beta}
EX=∫−∞∞xf(x)dx=−∫0∞xd(e−βx)=−xe−βx∣∣∣∣0+∞+∫0∞e−βxdx=β1
正态分布
计算提示,最下方,左边那项是标准正态分布的概率密度在实数域上的积分乘以 μ \mu μ,结果为 μ \mu μ,右边那个是奇函数,积分为0
③连续型随机变量函数的数学期望
(1)一维
设连续型随机变量X的概率密度为 f X ( x ) , Y = g ( X ) f_X(x),Y=g(X) fX(x),Y=g(X),其中 g ( x ) g(x) g(x)连续,则
E Y = E g ( X ) = ∫ − ∞ + ∞ g ( x ) f X ( x ) d x EY=Eg(X)=\int^{+\infty}_{-\infty}g(x)f_X(x)dx EY=Eg(X)=∫−∞+∞g(x)fX(x)dx
(2)二维
二维连续型随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度为 f ( x , y ) , Z = g ( X , Y ) , f(x,y),Z=g(X,Y), f(x,y),Z=g(X,Y),其中 g ( x , y ) g(x,y) g(x,y)连续,则 E Z = E g ( X , Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y EZ=Eg(X,Y)=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}g(x,y)f(x,y)dxdy EZ=Eg(X,Y)=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy
3.性质
(1) E C = C EC=C EC=C,(C为常数)
(2) E ( C X ) = C ⋅ E X E(CX)=C\cdot EX E(CX)=C⋅EX,(C为常数)
(3) E ( X 1 + X 2 + . . . + X n ) = E X 1 + E X 2 + . . . + E X n E(X_1+X_2+...+X_n)=EX_1+EX_2+...+EX_n E(X1+X2+...+Xn)=EX1+EX2+...+EXn
(4)若 X 1 , X 2 , . . . X n X_1,X_2,...X_n X1,X2,...Xn相互独立,则 E ( X 1 X 2 . . . X n ) = E X 1 E X 2 . . . E X n E(X_1X_2...X_n)=EX_1EX_2...EX_n E(X1X2...Xn)=EX1EX2...EXn
证明:
性质(3)
(证明两个变量的情况,可以推广到任意有限个随机变量之和的情况)
设二维随机变量
(
X
,
Y
)
(X,Y)
(X,Y)的概率密度为
f
(
x
,
y
)
,
f(x,y),
f(x,y),其边缘概率密度为
f
X
(
x
)
,
f
Y
(
y
)
,
f_X(x),f_Y(y),
fX(x),fY(y),由连续型二维随机变量的数学期望公式可知
E
(
X
+
Y
)
=
∫
−
∞
+
∞
∫
−
∞
+
∞
(
x
+
y
)
f
(
x
,
y
)
d
x
d
y
=
∫
−
∞
+
∞
x
[
∫
−
∞
+
∞
f
(
x
,
y
)
d
y
]
d
x
+
∫
−
∞
+
∞
y
[
∫
−
∞
+
∞
f
(
x
,
y
)
d
x
]
d
y
=
∫
−
∞
∞
x
f
X
(
x
)
d
x
+
∫
−
∞
∞
y
f
Y
(
y
)
d
y
=
E
(
X
)
+
E
(
Y
)
E(X+Y)=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}(x+y)f(x,y)dxdy=\int^{+\infty}_{-\infty}x[\int^{+\infty}_{-\infty}f(x,y)dy]dx+\int^{+\infty}_{-\infty}y[\int^{+\infty}_{-\infty}f(x,y)dx]dy\\= \int^{\infty}_{-\infty}xf_X(x)dx+\int^{\infty}_{-\infty}yf_Y(y)dy=E(X)+E(Y)
E(X+Y)=∫−∞+∞∫−∞+∞(x+y)f(x,y)dxdy=∫−∞+∞x[∫−∞+∞f(x,y)dy]dx+∫−∞+∞y[∫−∞+∞f(x,y)dx]dy=∫−∞∞xfX(x)dx+∫−∞∞yfY(y)dy=E(X)+E(Y)
性质(4)
同上,仅证明两个变量的情况
设二维随机变量
(
X
,
Y
)
(X,Y)
(X,Y)的概率密度为
f
(
x
,
y
)
,
f(x,y),
f(x,y),其边缘概率密度为
f
X
(
x
)
,
f
Y
(
y
)
,
f_X(x),f_Y(y),
fX(x),fY(y),又若
X
X
X和
Y
Y
Y相互独立,
f
(
x
,
y
)
=
f
X
(
x
)
⋅
f
Y
(
y
)
f(x,y)=f_X(x)\cdot f_Y(y)
f(x,y)=fX(x)⋅fY(y)(对独立变量有联合概率密度等于边缘概率密度的乘积)
E
(
X
Y
)
=
∫
−
∞
+
∞
∫
−
∞
+
∞
x
y
f
(
x
,
y
)
=
∫
−
∞
∞
∫
−
∞
∞
x
y
f
X
(
x
)
f
Y
(
y
)
d
x
d
y
=
[
∫
−
∞
∞
x
f
X
(
x
)
d
x
]
⋅
[
∫
−
∞
∞
y
f
Y
(
y
)
d
y
]
=
E
(
X
)
E
(
Y
)
E(XY)=\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}xyf(x,y)=\int^{\infty}_{-\infty}\int^{\infty}_{-\infty}xyf_X(x)f_Y(y)dxdy=[\int^{\infty}_{-\infty}xf_X(x)dx]\cdot[\int^{\infty}_{-\infty}yf_Y(y)dy]=E(X)E(Y)
E(XY)=∫−∞+∞∫−∞+∞xyf(x,y)=∫−∞∞∫−∞∞xyfX(x)fY(y)dxdy=[∫−∞∞xfX(x)dx]⋅[∫−∞∞yfY(y)dy]=E(X)E(Y)
二.方差
引例
方差是衡量 X X X分散程度的一个尺度
1.定义
设X是一个随机变量,若 E ( X − E X ) 2 E(X-EX)^2 E(X−EX)2存在,则称它为 X X X的方差,记为 D ( X ) D(X) D(X)或 V a r ( X ) Var(X) Var(X)或 D X DX DX,即: D X = E ( X − E X ) 2 DX=E(X-EX)^2 DX=E(X−EX)2
同时,记 D X \sqrt{DX} DX 为 X X X的标准差或均方差,记为 σ X \sigma_X σX即 σ X = D X \sigma_X=\sqrt{DX} σX=DX
由定义知,**其实方差就是随机变量函数X的函数 g ( X ) = ( X − E X ) 2 g(X)=(X-EX)^2 g(X)=(X−EX)2的数学期望,**于是:
对于离散型随机变量有:
D
(
X
)
=
∑
k
=
1
∞
[
x
k
−
E
(
X
)
]
2
p
k
D(X)=\sum\limits_{k=1}^{\infty}[x_k-E(X)]^2p_k
D(X)=k=1∑∞[xk−E(X)]2pk
其中
P
{
X
=
x
k
}
=
p
k
,
k
=
1
,
2
,
.
.
.
P\{X=x_k\}=p_k,k=1,2,...
P{X=xk}=pk,k=1,2,...是
X
X
X的分布律
对于连续型随机变量有:
D
(
X
)
=
∫
−
∞
+
∞
[
x
−
E
(
X
)
]
2
f
(
x
)
d
x
D(X)=\int^{+\infty}_{-\infty}[x-E(X)]^2f(x)dx
D(X)=∫−∞+∞[x−E(X)]2f(x)dx
计算:
D X = E X 2 − ( E X ) 2 DX=EX^2-(EX)^2 DX=EX2−(EX)2
证明:
D
(
X
)
=
E
(
[
X
−
E
(
X
)
]
2
)
=
E
(
X
2
−
2
X
⋅
E
(
X
)
+
[
E
(
X
)
]
2
)
=
E
(
X
2
)
−
2
E
(
X
)
2
+
E
(
X
)
2
=
E
(
X
2
)
−
[
E
(
X
)
]
2
D(X)=E([X-E(X)]^2)=E(X^2-2X\cdot E(X)+[E(X)]^2)=E(X^2)-2E(X)^2+E(X)^2=E(X^2)-[E(X)]^2
D(X)=E([X−E(X)]2)=E(X2−2X⋅E(X)+[E(X)]2)=E(X2)−2E(X)2+E(X)2=E(X2)−[E(X)]2
2.性质
(1) D C = 0 DC=0 DC=0,(C为常数)
(2) D ( C X ) = C 2 D X D(CX)=C^2DX D(CX)=C2DX, D ( X + C ) = D ( X ) \quad D(X+C)=D(X) D(X+C)=D(X)(C为常数)
(3)若 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn相互独立,则 D ( X 1 + X 2 + . . . + X n ) = D X 1 + D X 2 + . . . + D X n D(X_1+X_2+...+X_n)=DX_1+DX_2+...+DX_n D(X1+X2+...+Xn)=DX1+DX2+...+DXn
(4)
D
(
X
)
=
0
D(X)=0
D(X)=0的充要条件是
X
X
X以概率1取常数
E
(
X
)
E(X)
E(X),即
P
{
X
=
E
(
X
)
}
=
1
P\{X=E(X)\}=1
P{X=E(X)}=1
证明
性质(3)
以两个变量为例,设
X
,
Y
X,Y
X,Y有两个随机变量,则有
D
(
X
+
Y
)
=
D
X
+
D
Y
+
2
E
{
[
X
−
E
(
X
)
]
[
Y
−
E
(
Y
)
]
}
D(X+Y)=DX+DY+2E\{[X-E(X)][Y-E(Y)]\}
D(X+Y)=DX+DY+2E{[X−E(X)][Y−E(Y)]},若
X
,
Y
X,Y
X,Y相互独立,则有
D
(
X
+
Y
)
=
D
X
+
D
Y
D(X+Y)=DX+DY
D(X+Y)=DX+DY
证明如下:
D
(
X
+
Y
)
=
E
{
[
X
+
Y
−
E
(
X
+
Y
)
]
2
}
=
E
{
[
(
X
−
E
(
X
)
)
+
(
Y
−
E
(
Y
)
)
]
2
}
=
E
{
(
X
−
E
(
X
)
)
2
}
+
E
{
(
Y
−
E
(
Y
)
)
2
}
+
2
E
{
[
X
−
E
(
X
)
]
[
Y
−
E
(
Y
)
]
}
=
D
X
+
D
Y
+
2
E
{
[
X
−
E
(
X
)
]
[
Y
−
E
(
Y
)
]
}
D(X+Y)=E\{[X+Y-E(X+Y)]^2\}=E\{[(X-E(X))+(Y-E(Y))]^2\}=E\{(X-E(X))^2\}+E\{(Y-E(Y))^2\}\\+2E\{[X-E(X)][Y-E(Y)]\}=DX+DY+2E\{[X-E(X)][Y-E(Y)]\}
D(X+Y)=E{[X+Y−E(X+Y)]2}=E{[(X−E(X))+(Y−E(Y))]2}=E{(X−E(X))2}+E{(Y−E(Y))2}+2E{[X−E(X)][Y−E(Y)]}=DX+DY+2E{[X−E(X)][Y−E(Y)]}
若X、Y相互独立,则
E
(
X
Y
)
=
E
(
X
)
E
(
Y
)
E(XY)=E(X)E(Y)
E(XY)=E(X)E(Y)
2
E
{
[
X
−
E
(
X
)
]
[
Y
−
E
(
Y
)
]
}
=
2
E
{
X
Y
−
X
E
(
Y
)
−
Y
E
(
X
)
+
E
(
X
)
E
(
Y
)
}
=
2
{
E
(
X
Y
)
−
E
(
X
)
E
(
Y
)
−
E
(
Y
)
E
(
X
)
+
E
(
X
)
E
(
Y
)
}
=
0
2E\{[X-E(X)][Y-E(Y)]\}=2E\{XY-XE(Y)-YE(X)+E(X)E(Y)\}\\=2\{E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)\}=0
2E{[X−E(X)][Y−E(Y)]}=2E{XY−XE(Y)−YE(X)+E(X)E(Y)}=2{E(XY)−E(X)E(Y)−E(Y)E(X)+E(X)E(Y)}=0
3.常用随机变量期望、方差汇总
变量类型 | X | EX | DX |
---|---|---|---|
两点分布 | B ( 1 , p ) B(1,p) B(1,p) | p p p | p q pq pq |
二项分布 | B ( n , p ) B(n,p) B(n,p) | n p np np | n p q npq npq |
泊松分布 | P ( λ ) P(\lambda) P(λ) | λ \lambda λ | λ \lambda λ |
均匀分布 | U [ a , b ] U[a,b] U[a,b] | a + b 2 \dfrac{a+b}{2} 2a+b | ( b − a ) 2 12 \dfrac{(b-a)^2}{12} 12(b−a)2 |
指数分布 | E ( β ) E(\beta) E(β) | 1 β \dfrac{1}{\beta} β1 | 1 β 2 \dfrac{1}{\beta^2} β21 |
正态分布 | N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) | μ \mu μ | σ 2 \sigma^2 σ2 |
三.协方差
引入
1.定义
对于二维随机变量 ( X , Y ) (X,Y) (X,Y),称 C o v ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } Cov(X,Y)=E\{ [X-E(X)][Y-E(Y)]\} Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}为X与Y的协方差
计算:
C o v ( X , Y ) = E ( X Y ) − E X ⋅ E Y Cov(X,Y)=E(XY)-EX\cdot EY Cov(X,Y)=E(XY)−EX⋅EY
2.性质
若X,Y相互独立,则协方差为0,反之未必成立
(1) C o v ( X , Y ) = C o v ( Y , X ) , C o v ( X , X ) = D ( X ) Cov(X,Y)=Cov(Y,X),\qquad Cov(X,X)=D(X) Cov(X,Y)=Cov(Y,X),Cov(X,X)=D(X)
(方差是协方差的一种特殊情况,即当两个变量是相同的情况)
(2) C o v ( a X , b Y ) = a b C o v ( Y , X ) Cov(aX,bY)=abCov(Y,X) Cov(aX,bY)=abCov(Y,X)
(3) C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
(4) D ( X ± Y ) = D X + D Y ± 2 C o v ( X , Y ) D(X±Y)=DX+DY\pm2Cov(X,Y) D(X±Y)=DX+DY±2Cov(X,Y)
四.相关系数
协方差有量纲,数值随单位不同而不同,则不能准确评价两个随机变量之间的相依关系的程度大小,于是将其标准化,引出相关系数概念
1.定义
设 ( X , Y ) (X,Y) (X,Y)是一个二维随机变量,若 C o v ( X , Y ) Cov(X,Y) Cov(X,Y)存在, D X > 0 , D Y > 0 DX>0,DY>0 DX>0,DY>0,则称 ρ X Y = C o v ( X , Y ) D X ⋅ D Y = E ( X Y ) − E X ⋅ E Y D X ⋅ D Y \rho_{XY}=\dfrac{Cov(X,Y)}{\sqrt{DX}\cdot\sqrt{DY}}=\dfrac{E(XY)-EX\cdot EY}{\sqrt{DX}\cdot\sqrt{DY}} ρXY=DX ⋅DY Cov(X,Y)=DX ⋅DY E(XY)−EX⋅EY为X与Y的相关系数
若 ρ X Y = 0 \rho_{XY}=0 ρXY=0,则称X,Y不相关
2. ρ 的 性 质 \rho的性质 ρ的性质
(1) ∣ ρ ∣ ⩽ 1 |\rho|\leqslant 1 ∣ρ∣⩽1
(2) ∣ ρ ∣ = 1 ⟺ ∃ 常 数 a , b , 使 得 P { Y = a + b X } = 1 |\rho|=1 \iff \exists 常数a,b,使得P\{Y=a+bX\}=1 ∣ρ∣=1⟺∃常数a,b,使得P{Y=a+bX}=1
ρ \rho ρ的绝对值越接近1, D ( Y − b X ) D(Y-bX) D(Y−bX)越接近于0, Y , X Y,X Y,X越近似地有线性关系,所以 X , Y X,Y X,Y的相关系数是刻画 X , Y X,Y X,Y之间线性关系相关程度的一个数字特征,且 ρ \rho ρ无量纲,用起来方便
定义:
若 ρ X Y = 0 \rho_{XY}=0 ρXY=0,则称 X , Y X,Y X,Y不相关;若 ∣ ρ X Y ∣ = 1 |\rho_{XY}|=1 ∣ρXY∣=1,则称 X , Y X,Y X,Y完全相关
3.X,Y不相关的等价条件
(1) ρ X Y = 0 \rho_{XY}=0 ρXY=0
(2) C o v ( X , Y ) = 0 Cov(X,Y)=0 Cov(X,Y)=0
(3) E ( X Y ) = E X ⋅ E Y E(XY)=EX\cdot EY E(XY)=EX⋅EY
(4) D ( X + Y ) = D X + D Y D(X+Y)=DX+DY D(X+Y)=DX+DY
若X,Y相互独立,则X,Y不相关,反之未必成立
五.矩
设
X
X
X和
Y
Y
Y是随机变量,若
E
(
X
k
)
,
k
=
1
,
2
,
⋯
E(X^k),\quad k=1,2,\cdots
E(Xk),k=1,2,⋯
存在,称它为
X
X
X的
k
k
k阶原点矩,简称
k
k
k阶矩.
若 E { [ X − E ( X ) ] k } , k = 2 , 3 , ⋯ E\{[X-E(X)]^k\},\quad k=2,3,\cdots E{[X−E(X)]k},k=2,3,⋯
存在,称它为 X X X的 k k k阶中心矩
若 E ( X k Y l ) , k , l = 1 , 2 , ⋯ E(X^kY^l),\quad k,l=1,2,\cdots E(XkYl),k,l=1,2,⋯
存在,称它为 X X X和 Y Y Y的 k + l k+l k+l阶混合矩
若 E { [ X − E ( X ) ] k [ Y − E ( Y ) ] l } , k , l = 1 , 2 , ⋯ E\{ [X-E(X)]^k[Y-E(Y)]^l\},\quad k,l=1,2,\cdots E{[X−E(X)]k[Y−E(Y)]l},k,l=1,2,⋯
存在,称它为 X 和 Y X和Y X和Y的 k + l k+l k+l阶混合中心矩
X X X的数学期望 E ( X ) E(X) E(X)是 X X X的一阶原点矩,方差$ D(X) 是 是 是X 的 二 阶 中 心 矩 , 协 方 差 的二阶中心矩,协方差 的二阶中心矩,协方差Cov(X,Y) 是 是 是X 和 和 和Y$的二阶混合中心矩
六.总结
各个数字特征有什么意义呢?
数学期望描述平均值大小,方差描述与数学期望的离散程度,
协方差衡量两个变量的总体误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值
相关系数可用来描述随机变量 ( X , Y ) (X,Y) (X,Y)的两个分量 X , Y X,Y X,Y之间的线性关系紧密程度
还看到两个很棒的解释