概率论与数理统计——多维随机变量及其分布

文章目录


二维随机变量及其分布


1.二维随机变量

设E是随机试验,样本空间Ω={ω},由X=X(ω),Y=Y(ω)构成的向量(X,Y)称为二维随机变量


2.联合分布函数

设(X,Y)是二维随机变量,x,y是两个任意实数,则称定义在平面上的二元函数P{X≤x,Y≤y}为(X,Y)的分布函数,或称为X和Y的联合分布函数,记作F(x,y),即
              F ( x , y ) = P { X ≤ x , Y ≤ y } F(x,y)=P\{X≤x,Y≤y\} F(x,y)=P{X≤x,Y≤y}

联合分布函数的性质:
(1)0≤F(x,y)≤1,且F(-∞,y)=F(x,-∞)=F(-∞,-∞)=0,F(+∞,+∞)=1
(2)F(x,y)是变量x或y的单调不减函数
(3)F(x,y)=F(x+0,y),F(x,y)=F(x,y+0),F(x,y)关于x或y都是右连续的

(4)对任意的(x1,y1),(x2,y2):当x1<x2,y1<y2时有

     P { x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 } = F ( x 2 , y 2 ) − F ( x 1 , y 2 ) − F ( x 2 , y 1 ) + F ( x 1 , y 1 ) P\{x_{1}<X≤x_{2},y_{1}<Y≤y_{2}\}=F(x_{2},y_{2})-F(x_{1},y_{2})-F(x_{2},y_{1})+F(x_{1},y_{1}) P{x1​<X≤x2​,y1​<Y≤y2​}=F(x2​,y2​)−F(x1​,y2​)−F(x2​,y1​)+F(x1​,y1​)


3.二维离散型随机变量

若(X,Y)所有可能取值为( x i , y j x_{i},y_{j} xi​,yj​), i , j = 1 , 2 , ⋅ ⋅ ⋅ i,j=1,2,··· i,j=1,2,⋅⋅⋅,则

              P { X = x i , Y = y j } = p i j P\{X=x_{i},Y=y_{j}\}=p_{ij} P{X=xi​,Y=yj​}=pij​

称为联合分布律,联合分布律可列表如下:

p p p   Y Y Y X \\X X      y 1 y_{1} y1​    ···     y 1 y_{1} y1​    ···
x 1 x_{1} x1​
···
x i x_{i} xi​
···
     p 11 p_{11} p11​    ···     p 1 j p_{1j} p1j​    ···
    ···         ···     
     p i 1 p_{i1} pi1​    ···     p i j p_{ij} pij​    ···
    ···         ···     

联合分布律的性质: p i j ≥ 0 , ∑ i = 1 ∞ ∑ j = 1 ∞ = 1 p_{ij}≥0,\sum_{i=1}^{\infty}\sum_{j=1}^{\infty}=1 pij​≥0,∑i=1∞​∑j=1∞​=1


4.二维连续型随机变量

若分布函数 F ( x , y ) = ∫ − ∞ x ∫ − ∞ y f ( μ , ν ) d μ d ν F(x,y)=\int_{-\infty}^{x}\int_{-\infty}^{y}f(μ,ν)dμdν F(x,y)=∫−∞x​∫−∞y​f(μ,ν)dμdν,则称(X,Y)是连续型随机变量,f(x,y)称为(X,Y)的联合概率密度

联合概率密度的性质:
(1) f ( x , y ) ≥ 0 ; f(x,y)≥0; f(x,y)≥0;      ∫ − ∞ + ∞ ∫ − ∞ + ∞ f ( x , y ) d x d y = 1 ; \int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}f(x,y)dxdy=1; ∫−∞+∞​∫−∞+∞​f(x,y)dxdy=1;

(2)若 f ( x , y ) f(x,y) f(x,y)在点 ( x , y ) (x,y) (x,y)处连续,则    ∂ 2 F ( x , y ) ∂ x ∂ y = f ( x , y ) . \frac{\partial^2F(x,y) }{\partial x\partial y}=f(x,y). ∂x∂y∂2F(x,y)​=f(x,y).

(3)设G是xOy平面上一个区域,则    P { ( X , Y ) ∈ G } = ∬ G f ( x , y ) d x d y . P\{(X,Y)∈G\}=\iint_{G}f(x,y)dxdy. P{(X,Y)∈G}=∬G​f(x,y)dxdy.


边缘分布


1.边缘分布函数

设二维随机变量(X,Y)的分布函数为F(x,y),分别称函数

       F X ( x ) = lim ⁡ y → + ∞ F ( x , y ) = F ( x , + ∞ ) F_{X}(x)=\lim_{y\rightarrow +\infty}F(x,y)=F(x,+\infty) FX​(x)=limy→+∞​F(x,y)=F(x,+∞)和 F Y ( y ) = lim ⁡ x → + ∞ F ( x , y ) = F ( + ∞ , y ) F_{Y}(y)=\lim_{x\rightarrow +\infty}F(x,y)=F(+\infty,y) FY​(y)=limx→+∞​F(x,y)=F(+∞,y)

为(X,Y)的边缘分布函数


2.边缘分布律

设二维离散型随机变量 ( X , Y ) (X,Y) (X,Y)的联合分布律为 P { X = x i , Y = y j } = p i j P\{X=x_{i},Y=y_{j}\}=p_{ij} P{X=xi​,Y=yj​}=pij​
则分别称
          p i ⋅ = ∑ j = 1 ∞ p i j = P { X = x i } ( i = 1 , 2 , ⋅ ⋅ ⋅ ) p_{i·}=\sum_{j=1}^{\infty}p_{ij}=P\{X=x_{i}\}(i=1,2,···) pi⋅​=∑j=1∞​pij​=P{X=xi​}(i=1,2,⋅⋅⋅)

          p ⋅ j = ∑ i = 1 ∞ p i j = P { Y = Y j } ( j = 1 , 2 , ⋅ ⋅ ⋅ ) p_{·j}=\sum_{i=1}^{\infty}p_{ij}=P\{Y=Y_{j}\}(j=1,2,···) p⋅j​=∑i=1∞​pij​=P{Y=Yj​}(j=1,2,⋅⋅⋅)

为 ( X , Y ) (X,Y) (X,Y)关于 X X X和 Y Y Y的边缘分布律。


3.边缘概率密度

设二维连续型随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度为 f ( x , y ) f(x,y) f(x,y),则

f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y f_{X}(x)=\int_{-\infty}^{+\infty}f(x,y)dy fX​(x)=∫−∞+∞​f(x,y)dy和 f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d x f_{Y}(y)=\int_{-\infty}^{+\infty}f(x,y)dx fY​(y)=∫−∞+∞​f(x,y)dx

分别称为 ( X , Y ) (X,Y) (X,Y)关于X和Y的边缘概率密度


4.常用的二维分布

(1)二维均匀分布:如果二维随机变量 ( X , Y ) (X,Y) (X,Y)有概率密度

f ( x , y ) = { 1 A , ( x , y ) ∈ G 0 , e l s e f(x,y)=\left\{\begin{matrix} \frac{1}{A}& ,(x,y)\in G\\ 0& ,else \end{matrix}\right. f(x,y)={A1​0​,(x,y)∈G,else​

其中 G G G为平面有界区域, A A A为其面积,则称 ( X , Y ) (X,Y) (X,Y)在 G G G上服从二维均匀分布。


(2)二维正态分布:如果二维随机变量 ( X , Y ) (X,Y) (X,Y)有概率密度为

f ( x , y ) = 1 2 π σ 1 σ 2 1 − ρ 2 e x p { − 1 2 ( 1 − ρ 2 ) [ − ( x − μ ) 2 σ 1 2 − 2 ρ ( x − μ 1 ) ( y − μ 2 ) σ 1 σ 2 + ( y − μ 2 ) 2 σ 2 2 ] } f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^{2}}}exp\{-\frac{1}{2(1-\rho^2)}[-\frac{(x-\mu)^2}{\sigma^2_1}-2\rho\frac{(x-\mu_{1})(y-\mu_{2})}{\sigma_{1}\sigma_{2}}+\frac{(y-\mu_2)^2}{\sigma^2_2}]\} f(x,y)=2πσ1​σ2​1−ρ2 ​1​exp{−2(1−ρ2)1​[−σ12​(x−μ)2​−2ρσ1​σ2​(x−μ1​)(y−μ2​)​+σ22​(y−μ2​)2​]}

其中 μ 1 , μ 2 , σ 1 , σ 2 , ρ \mu_1,\mu_2,\sigma_1,\sigma_2,\rho μ1​,μ2​,σ1​,σ2​,ρ均为常数,且 σ 1 \sigma_1 σ1​>0, σ 2 \sigma_2 σ2​>0,-1< ρ \rho ρ<1,则称(X,Y)服从参数 μ 1 , μ 2 , σ 1 , σ 2 , ρ \mu_1,\mu_2,\sigma_1,\sigma_2,\rho μ1​,μ2​,σ1​,σ2​,ρ的二维正态分布,记作

          ( X , Y ) (X,Y) (X,Y)~ N ( μ 1 , σ 1 2 ; μ 2 , σ 2 2 ; ρ ) N(\mu_1,\sigma_1^2;\mu_2,\sigma_2^2;\rho) N(μ1​,σ12​;μ2​,σ22​;ρ)

特别,当 μ 1 = μ 2 = 0 , σ 1 = σ 2 = 1 \mu_1=\mu_2=0,\sigma_1=\sigma_2=1 μ1​=μ2​=0,σ1​=σ2​=1时,则称 ( X , Y ) (X,Y) (X,Y)服从标准正态分布。

性质: ( X , Y ) (X,Y) (X,Y)~ N ( μ 1 , σ 1 2 ; μ 2 , σ 2 2 ; ρ ) ⇒ X N(\mu_1,\sigma_1^2;\mu_2,\sigma_2^2;\rho)\Rightarrow X N(μ1​,σ12​;μ2​,σ22​;ρ)⇒X~ N ( μ 1 , σ 1 2 ) , Y N(\mu_1,\sigma_1^2),Y N(μ1​,σ12​),Y ~ N ( μ 2 , σ 2 2 ; ) N(\mu_2,\sigma_2^2;) N(μ2​,σ22​;).   逆命题不成立


条件分布


1.条件分布律

设 ( X , Y ) (X,Y) (X,Y)是二维离散型随机变量,若 p ⋅ j p_{·j} p⋅j​>0,则称

p X ∣ Y ( i ∣ j ) = P { X = x i ∣ Y = y j } = p i j p ⋅ j p_{X|Y}(i|j)=P\{X=x_i|Y=y_j\}=\frac{p_{ij}}{p_{·j}} pX∣Y​(i∣j)=P{X=xi​∣Y=yj​}=p⋅j​pij​​    ( i = 1 , 2 , ⋅ ⋅ ⋅ ) (i=1,2,···) (i=1,2,⋅⋅⋅)

为在 { Y = y j } \{Y=y_j\} {Y=yj​}条件下随机变量X的条件分布律。

若 p i ⋅ p_{i·} pi⋅​>0,则称

p Y ∣ X ( j ∣ i ) = P { Y = y j ∣ X = x i } = p i j p i ⋅ p_{Y|X}(j|i)=P\{Y=y_j|X=x_i\}=\frac{p_{ij}}{p_{i·}} pY∣X​(j∣i)=P{Y=yj​∣X=xi​}=pi⋅​pij​​    ( i = 1 , 2 , ⋅ ⋅ ⋅ ) (i=1,2,···) (i=1,2,⋅⋅⋅)

为在 { X = x i } \{X=x_i\} {X=xi​}条件下随机变量Y的条件分布律。


2.条件概率密度

设 ( X , Y ) (X,Y) (X,Y)是二维连续型随机变量,若 f Y ( y ) f_Y(y) fY​(y)>0,则称

f X ∣ Y = f ( x , y ) f Y ( y ) f_{X|Y}=\frac{f(x,y)}{f_Y(y)} fX∣Y​=fY​(y)f(x,y)​    ( − ∞ < x < + ∞ ) (-\infty<x<+\infty) (−∞<x<+∞)

为在 { Y = y } \{Y=y\} {Y=y}条件下X的条件概率密度。
若 f X ( x ) f_X(x) fX​(x)>0,则称

f Y ∣ X = f ( x , y ) f X ( x ) f_{Y|X}=\frac{f(x,y)}{f_X(x)} fY∣X​=fX​(x)f(x,y)​    ( − ∞ < x < + ∞ ) (-\infty<x<+\infty) (−∞<x<+∞)

为在 { X = x } \{X=x\} {X=x}条件下Y的条件概率密度。


随机变量的独立性


1.随机变量的独立性

若二维随机变量 ( X , Y ) (X,Y) (X,Y)对任意实数均有

P { X ≤ x , Y ≤ y } = P { X ≤ x } P { Y ≤ y } P\{X≤x,Y≤y\}=P\{X≤x\}P\{Y≤y\} P{X≤x,Y≤y}=P{X≤x}P{Y≤y}      即 F ( x , y ) = F X ( x ) ⋅ F Y ( y ) F(x,y)=F_X(x)·F_Y(y) F(x,y)=FX​(x)⋅FY​(y),

则X与Y相互独立


2.离散型随机变量相互独立的充要条件

p i j = p i ⋅ ⋅ p ⋅ j p_{ij}=p_{i·}·p_{·j} pij​=pi⋅​⋅p⋅j​,    i , j = 1 , 2 , ⋅ ⋅ ⋅ i,j=1,2,··· i,j=1,2,⋅⋅⋅


3.连续型随机变量相互独立的充要条件

f ( x , y ) = f X ( x ) ⋅ f Y ( y ) f(x,y)=f_X(x)·f_Y(y) f(x,y)=fX​(x)⋅fY​(y),    x , y x,y x,y为任意实数


多维随机变量函数的分布


1.二维随机变量函数的分布

(1)已知离散型随机变量 ( X , Y ) (X,Y) (X,Y)的分布律 P { X = x i , Y = y i } = p i j P\{X=x_i,Y=y_i\}=p_{ij} P{X=xi​,Y=yi​}=pij​,则 Z = g ( x , y ) Z=g(x,y) Z=g(x,y)的分布为

       P { Z = z k } = P { g ( X , Y ) = z k } = ∑ g ( x i , y j ) = k p i j P\{Z=z_k\}=P\{g(X,Y)=z_k\}=\sum_{g(x_i,y_j)=k}p_{ij} P{Z=zk​}=P{g(X,Y)=zk​}=∑g(xi​,yj​)=k​pij​

(2)设连续型随机变量 ( X , Y ) (X,Y) (X,Y)的概率密度为 f ( x , y ) f(x,y) f(x,y),则 Z = g ( X , Y ) Z=g(X,Y) Z=g(X,Y)的分布函数为

       F Z ( z ) = P { Z ≤ z } = ∬ g ( x , y ) ≤ z f ( x , y ) d x d y F_Z(z)=P\{Z≤z\}=\iint_{g(x,y)≤z}f(x,y)dxdy FZ​(z)=P{Z≤z}=∬g(x,y)≤z​f(x,y)dxdy

概率密度 f Z ( z ) = F Z ‘ ( z ) f_Z(z)=F_Z`(z) fZ​(z)=FZ​‘(z).


特殊类型:


① Z = X + Y Z=X+Y Z=X+Y密度函数为

       f Z ( z ) = ∫ − ∞ + ∞ f ( x , z − x ) d x = ∫ − ∞ + ∞ f ( z − y , y ) d y f_Z(z)=\int_{-\infty}^{+\infty}f(x,z-x)dx=\int_{-\infty}^{+\infty}f(z-y,y)dy fZ​(z)=∫−∞+∞​f(x,z−x)dx=∫−∞+∞​f(z−y,y)dy

特别,当 X X X与 Y Y Y相互独立时

       f Z ( z ) = f X ∗ f Y = ∫ − ∞ + ∞ f X ( x ) f Y ( z − x ) d x = ∫ − ∞ + ∞ f X ( z − y ) f Y ( y ) d y f_Z(z)=f_X*f_Y=\int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)dx=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)dy fZ​(z)=fX​∗fY​=∫−∞+∞​fX​(x)fY​(z−x)dx=∫−∞+∞​fX​(z−y)fY​(y)dy


②设 X X X ~ N ( μ 1 , σ 1 2 ) N(\mu_1,\sigma_1^2) N(μ1​,σ12​), Y Y Y ~ N ( μ 2 , σ 2 2 ) N(\mu_2,\sigma_2^2) N(μ2​,σ22​),且 X X X, Y Y Y相互独立,则

       a X + b Y aX+bY aX+bY ~ N ( a μ 1 + b μ 2 , a 2 σ 1 2 + b 2 σ 2 2 ) N(a\mu_1+b\mu_2,a^2\sigma_1^2+b^2\sigma_2^2) N(aμ1​+bμ2​,a2σ12​+b2σ22​)

③设 X X X, Y Y Y相互独立,分布函数分别为 F X ( x ) 和 F Y ( y ) F_X(x)和F_Y(y) FX​(x)和FY​(y), M = m a x ( X , Y ) M=max(X,Y) M=max(X,Y), N = m i n ( X , Y ) N=min(X,Y) N=min(X,Y),
       F M ( z ) = F X ( z ) F Y ( z ) F_M(z)=F_X(z)F_Y(z) FM​(z)=FX​(z)FY​(z),
       F N ( z ) = 1 − [ 1 − F X ( z ) ] [ 1 − F Y ( z ) ] F_N(z)=1-[1-F_X(z)][1-F_Y(z)] FN​(z)=1−[1−FX​(z)][1−FY​(z)].

④ Z = X Y Z=\frac{X}{Y} Z=YX​的密度函数为

       f Z ( z ) = ∫ − ∞ + ∞ ∣ y ∣ f ( y z , y ) d y f_Z(z)=\int_{-\infty}^{+\infty}|y|f(yz,y)dy fZ​(z)=∫−∞+∞​∣y∣f(yz,y)dy,
X X X, Y Y Y相互独立时,

       f Z ( z ) = ∫ − ∞ + ∞ ∣ y ∣ f X ( y z ) f Y ( y ) d y f_Z(z)=\int_{-\infty}^{+\infty}|y|f_X(yz)f_Y(y)dy fZ​(z)=∫−∞+∞​∣y∣fX​(yz)fY​(y)dy,

⑤ Z = Y X Z=\frac{Y}{X} Z=XY​的密度函数为

       f Z ( z ) = ∫ − ∞ + ∞ ∣ x ∣ f ( x , x z ) d x f_Z(z)=\int_{-\infty}^{+\infty}|x|f(x,xz)dx fZ​(z)=∫−∞+∞​∣x∣f(x,xz)dx,
X X X, Y Y Y相互独立时,
       f Z ( z ) = ∫ − ∞ + ∞ ∣ x ∣ f X ( x ) f Y ( x z ) d x f_Z(z)=\int_{-\infty}^{+\infty}|x|f_X(x)f_Y(xz)dx fZ​(z)=∫−∞+∞​∣x∣fX​(x)fY​(xz)dx,

⑥ Z = X Y Z=XY Z=XY的密度函数为

       f Z ( z ) = 1 ∣ x ∣ f ( x , z x ) d x f_Z(z)=\frac{1}{|x|}f(x,\frac{z}{x})dx fZ​(z)=∣x∣1​f(x,xz​)dx,
X X X, Y Y Y相互独立时,

       f Z ( z ) = 1 ∣ x ∣ f X ( x ) f Y ( z x ) d x f_Z(z)=\frac{1}{|x|}f_X(x)f_Y(\frac{z}{x})dx fZ​(z)=∣x∣1​fX​(x)fY​(xz​)dx.

2.多维随机变量函数的分布

对于相互独立的多维随机变量所构成的简单函数,可利用二维随机变量的结果加以推广。
常用结论及公式如下
(1)设 X 1 , X 2 , ⋅ ⋅ ⋅ , X n X_1,X_2,···,X_n X1​,X2​,⋅⋅⋅,Xn​相互独立,且 X i X_i Xi​ ~ N ( μ i , σ i 2 ) N(\mu_i,\sigma_i^2) N(μi​,σi2​), k i k_i ki​为任意常数, ( i = 1 , 2 , ⋅ ⋅ ⋅ , n ) (i=1,2,···,n) (i=1,2,⋅⋅⋅,n),则

Z = ∑ i = 1 n k i X i Z=\sum^n_{i=1}k_iX_i Z=∑i=1n​ki​Xi​ ~ N ( ∑ i = 1 n k i μ i , ∑ i = 1 n k i 2 σ i 2 ) N(\sum^n_{i=1}k_i\mu_i,\sum_{i=1}^nk_i^2\sigma_i^2) N(∑i=1n​ki​μi​,∑i=1n​ki2​σi2​).

(2)设 X 1 , X 2 , ⋅ ⋅ ⋅ , X n X_1,X_2,···,X_n X1​,X2​,⋅⋅⋅,Xn​相互独立,且 X i X_i Xi​的分布函数为 F X i ( x i ) ( i = 1 , 2 , ⋅ ⋅ ⋅ , n ) F_{X_i}(x_i)(i=1,2,···,n) FXi​​(xi​)(i=1,2,⋅⋅⋅,n),则 Z = m a x { X 1 , X 2 , ⋅ ⋅ ⋅ , X n } Z=max\{X_1,X_2,···,X_n\} Z=max{X1​,X2​,⋅⋅⋅,Xn​}的分布函数为

       F m a x ( z ) = F X 1 ( z ) F X 2 ( z ) ⋅ ⋅ ⋅ F X n ( z ) F_{max}(z)=F_{X_1}(z)F_{X_2}(z)···F_{X_n}(z) Fmax​(z)=FX1​​(z)FX2​​(z)⋅⋅⋅FXn​​(z)

Z = m i n { X 1 , X 2 , ⋅ ⋅ ⋅ , X n } Z=min\{X_1,X_2,···,X_n\} Z=min{X1​,X2​,⋅⋅⋅,Xn​}的分布函数为

       F m i n ( z ) = 1 − [ 1 − F X 1 ( z ) ] [ 1 − F X 2 ( z ) ] ⋅ ⋅ ⋅ [ 1 − F X n ( z ) ] F_{min}(z)=1-[1-F_{X_1}(z)][1-F_{X_2}(z)]···[1-F_{X_n}(z)] Fmin​(z)=1−[1−FX1​​(z)][1−FX2​​(z)]⋅⋅⋅[1−FXn​​(z)]

上一篇:【论文】LayerNorm


下一篇:CockroachDB实现的Gossip协议源码分析