常用连续分布

正态分布

若随机变量 \(X\) 的密度函数为

\[p(x)=\frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}},-\infty<x<\infty \]

则称 \(X\) 服从正态分布 , 称 \(X\) 为正态变量 , 记作 \(X\sim N(\mu,\sigma^2)\) . 其中位置参数 \(-\infty<\mu<+\infty\) , 尺度参数 \(\sigma>0\).

正态分布 \(N(\mu,\sigma^2)\) 的分布函数为

\[F(x)=\frac{1}{\sqrt{2 \pi} \sigma} \int_{-\infty}^{x} \mathrm{e}^{-\frac{(t-\mu)^{2}}{2 \sigma^{2}}} \mathrm{~d} t \]

标准正态分布

称 \(\mu=0,\sigma=1\) 时的正态分布 \(N(0,1)\)为标准正态分布.
通常记标准正态变量为 \(U\) , 记标准正态分布的密度函数为 \(\varphi(u)\) , 分布函数为 \(\Phi(u)\) , 即

\[\varphi(u)=\frac{1}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{u^{2}}{2}},-\infty<u<\infty \]

\[\Phi(u)=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{u} \mathrm{e}^{-\frac{t^{2}}{2}} \mathrm{~d} t,-\infty<u<\infty \]

若随机变量 \(X\sim N(\mu,\sigma^2)\) , 则 \(U=(X-\mu)/\sigma\sim N(0,1)\)

证明:

记 \(X\) 与 \(U\) 的分布函数分别为 \(F_{X}(x)\) 与 \(F_{U}(u)\) , 则由分布函数的定义知

\[\begin{aligned} F_{U}(u) &=P(U \leqslant u)=P\left(\frac{X-\mu}{\sigma} \leqslant u\right) \\ &=P(X \leqslant \mu+\sigma u)=F_{X}(\mu+\sigma u) \end{aligned} \]

由于正态分布函数是严格单调增函数,且处处可导,因此若记 \(X\) 与 \(U\) 的密度函数分别为 \(P_{X}(x)\) 与 \(P_{U}(u)\) , 则

\[p_{U}(u)=\frac{\mathrm{d}}{\mathrm{d} u} F_{X}(\mu+\sigma u)=p_{X}(\mu+\sigma u) \cdot \sigma=\frac{1}{\sqrt{2 \pi}} \mathrm{e}^{-u^{2} / 2} \]

由此得

\[U=\frac{X-\mu}{\sigma} N(0,1) \]

由以上定理,我们马上可以得到一些在实际中有用的计算公式,若随机变量 \(X\sim N(\mu,\sigma^2)\) , 则

\[P(X \leqslant c)=\Phi\left(\frac{c-\mu}{\sigma}\right) \]

\[P(a<X \leqslant b)=\Phi\left(\frac{b-\mu}{\sigma}\right)-\Phi\left(\frac{a-\mu}{\sigma}\right) \]

正态分布的数学期望与方差

设随机变量 \(X\sim N(\mu,\sigma^2)\) , 由于 \(U=(X-\mu)/\sigma\sim N(0,1)\) , 所以 \(U\) 的数学期望为

\[E(U)=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{\infty} u \mathrm{e}^{-\frac{u^{2}}{2}} \mathrm{~d} u \]

注意到上述积分的被积函数为一个奇函数,所以其积分值等于 \(0\) , 即 \(E(U)= 0\)又因为 \(X=\mu+\sigma U\) , 所以由数学期望的性质得

\[E(X)=\mu+\sigma \times 0=\mu \]

又因为

\[\begin{aligned} \operatorname{Var}(U) &=E\left(U^{2}\right)-[E(U)]^2=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{\infty} u^{2} \mathrm{e}^{-\frac{u^{2}}{2}} \mathrm{~d} u \\ &=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{\infty} u \mathrm{~d}\left(-\mathrm{e}^{-\frac{u^{2}}{2}}\right)\\ &=\frac{1}{\sqrt{2 \pi}}\left(-\left.u \mathrm{e}^{-\frac{u^{2}}{2}}\right|_{-\infty} ^{\infty}+\int_{-\infty}^{\infty} \mathrm{e}^{-\frac{u^{2}}{2}} \mathrm{~d} u\right) \\ &=\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{\infty} \mathrm{e}^{-\frac{u^{2}}{2}} \mathrm{~d} u=\frac{1}{\sqrt{2 \pi}} \sqrt{2 \pi}=1 \end{aligned} \]

且 \(X=\mu+\sigma U\) , 所以由方差的性质得

\[\operatorname{Var}(X)=\operatorname{Var}(\mu+\sigma U)=\sigma^{2} \]

均匀分布

若随机变量 \(X\) 的密度函数为

\[p(x)=\left\{\begin{array}{ll} \dfrac{1}{b-a}, & a<x<b, \\ 0, & \text { 其他. } \end{array}\right. \]

则称 \(X\) 服从区间 \((a,b)\) 上的均匀分布 , 记作 \(X\sim U(a,b)\) , 其分布函数为

\[F(x)=\left\{\begin{array}{ll} 0, & x<a \\ \dfrac{x-a}{b-a}, & a \leqslant x<b, \\ 1, & x \geqslant b . \end{array}\right. \]

均匀分布的数学期望与方差

设随机变量 \(X\sim U(a,b)\) , 则

\[E(X)=\int_{a}^{b} \frac{x}{b-a} d x=\frac{b^{2}-a^{2}}{2(b-a)}=\frac{a+b}{2} \]

又因为

\[E\left(X^{2}\right)=\int_{a}^{b} \frac{x^{2}}{b-a} \mathrm{~d} x=\frac{b^{3}-a^{3}}{3(b-a)}=\frac{a^{2}+a b+b^{2}}{3} \]

由此得 \(X\) 的方差为

\[\operatorname{Var}(X)=E\left(X^{2}\right)-[E(X)]^{2}=\frac{a^{2}+a b+b^{2}}{3}-\frac{(a+b)^{2}}{4}=\frac{(b-a)^{2}}{12} \]

指数分布

若随机变量 \(X\) 的密度函数为

\[p(x)=\left\{\begin{array}{cl} \lambda \mathrm{e}^{-\lambda x}, & x \geqslant 0 \\ 0, & x<0 \end{array}\right. \]

则称 \(X\) 服从指数分布 , 记作 \(X\sim Exp(\lambda)\) , 其中参数 \(\lambda>0\) , 指数分布的分布函数为

\[F(x)=\left\{\begin{array}{cl} 1-\mathrm{e}^{-\lambda x}, & x \geqslant 0 \\ 0, & x<0 \end{array}\right. \]

指数分布的数学期望与方差

设随机变量 \(X\sim Exp(\lambda)\) , 则

\[\begin{aligned} E(X) &=\int_{0}^{\infty} x \lambda \mathrm{e}^{-\lambda x} \mathrm{~d} x=\int_{0}^{\infty} x \mathrm{~d}\left(-\mathrm{e}^{-\lambda x}\right) \\ &=-\left.x \mathrm{e}^{-\lambda x}\right|_{0} ^{\infty}+\int_{0}^{\infty} \mathrm{e}^{-\lambda x} \mathrm{~d} x=-\left.\frac{1}{\lambda} \mathrm{e}^{-\lambda x}\right|_{0} ^{\infty}=\frac{1}{\lambda} \end{aligned} \]

又因为

\[\begin{aligned} E\left(X^{2}\right) &=\int_{0}^{\infty} x^{2} \lambda \mathrm{e}^{-\lambda x} \mathrm{~d} x=\int_{0}^{\infty} x^{2} \mathrm{~d}\left(-\mathrm{e}^{-\lambda x}\right) \\ &=-\left.x^{2} \mathrm{e}^{-\lambda x}\right|_{0} ^{\infty}+2 \int_{0}^{\infty} x \mathrm{e}^{-\lambda x} \mathrm{~d} x=\frac{2}{\lambda^{2}} \end{aligned} \]

由此得 \(X\) 的方差为

\[\operatorname{Var}(X)=E\left(X^{2}\right)-[E(X)]^{2}=\frac{2}{\lambda^{2}}-\frac{1}{\lambda^{2}}=\frac{1}{\lambda^{2}} \]

指数分布的无记忆性

如果随机变量 \(X\sim Exp(\lambda)\) , 则对任意 \(s>0,t>0\) , 有

\[P(X>s+t \mid X>s)=P(X>t) \]

上式的含义为:记 \(X\) 是某种产品的使用寿命 \((h)\) , 若 \(X\) 服从指数分布,那么已知此产品使用了 \(s(h)\) 没发生故障,则再能使用 \(t (h)\) 而不发生故障的概率与已使用的 \(s (h)\)无关,只相当于重新开始使用 \(t ( h)\) 的概率,即对已使用过的 \(s (h)\) 没有记忆.

证明:

因为 \(X\sim Exp(\lambda)\) , 所以 \(P(X>s)=e^{-\lambda s},s>0\) . 又因为

\[(X>s+t) \subseteq(X>s) \]

于是条件概率

\[P(X>s+t \mid X>s)=\frac{P(X>s+t)}{P(X>s)}=\frac{\mathrm{e}^{-\lambda(s+t)}}{\mathrm{e}^{-\lambda s}}=\mathrm{e}^{-\lambda t}=P(X>t) \]

即证.

伽马分布

若随机变量 \(X\) 的密度函数为

\[p(x)=\left\{\begin{array}{ll} \dfrac{\lambda^{\alpha}}{\Gamma(\alpha)} x^{\alpha-1} \mathrm{e}^{-\lambda x}, & x \geqslant 0 \\ 0, & x<0 \end{array}\right. \]

则称 \(X\) 服从伽马分布 , 记作 \(X\sim Ga(\alpha,\lambda)\) , 其中形状参数 \(\alpha>0\) , 尺度参数 \(\lambda>0\) .

伽马分布的数学期望与方差

\[E(X)=\frac{\lambda^{\alpha}}{\Gamma(\alpha)} \int_{0}^{\infty} x^{\alpha} \mathrm{e}^{-\lambda x} \mathrm{~d} x=\frac{\Gamma(\alpha+1)}{\Gamma(\alpha)} \frac{1}{\lambda}=\frac{\alpha}{\lambda} \]

\[E\left(X^{2}\right)=\frac{\lambda^{\alpha}}{\Gamma(\alpha)} \int_{0}^{\infty} x^{\alpha+1} \mathrm{e}^{-\lambda x} \mathrm{~d} x=\frac{\Gamma(\alpha+2)}{\lambda^{2} \Gamma(\alpha)}=\frac{\alpha(\alpha+1)}{\lambda^{2}} \]

\[\operatorname{Var}(X)=E\left(X^{2}\right)-[E(X)]^{2}=\frac{\alpha(\alpha+1)}{\lambda^{2}}-\left(\frac{\alpha}{\lambda}\right)^{2}=\frac{\alpha}{\lambda^{2}} \]

伽马分布的两个特例

1.\(\alpha =1\) 时的伽马分布就是指数分布, 即

\[G a(1, \lambda)=Exp(\lambda) \]

2.称 \(\alpha=n/2,\lambda=1/2\) 时的伽马分布是*度为 \(n\) 的 \(\chi^{2}\)(卡方)分布,记为 \(\chi^2(n)\) , 即

\[G a\left(\frac{n}{2}, \frac{1}{2}\right)=\chi^{2}(n) \]

其密度函数为

\[p(x)=\left\{\begin{array}{cc} \dfrac{1}{2^{\frac{n}{2}} \Gamma\left(\frac{n}{2}\right)} \mathrm{e}^{-\frac{x}{2}} x^{\frac{n}{2}-1} & x>0 \\ 0 & x \leqslant 0 \end{array}\right. \]

\[E(X)=n, \quad \operatorname{Var}(X)=2 n \]

贝塔分布

若随机变量 \(X\) 的密度函数为

\[p(x)=\left\{\begin{array}{cc} \dfrac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} x^{a-1}(1-x)^{b-1} & 0<x<1, \\ 0 & \text { 其他 }, \end{array}\right. \]

则称 \(X\) 服从贝塔分布 , 记作 \(X\sim Be(a,b)\) , 其中形状参数 \(a>0,b>0\) .

贝塔分布的数学期望与方差

\[\begin{aligned} E(X) &=\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} \int_{0}^{1} x^{a}(1-x)^{b-1} \mathrm{~d} x \\ &=\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} \cdot \frac{\Gamma(a+1) \Gamma(b)}{\Gamma(a+b+1)}=\frac{a}{a+b} \end{aligned} \]

\[\begin{aligned} E\left(X^{2}\right) &=\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} \int_{0}^{1} x^{a+1}(1-x)^{b-1} \mathrm{~d} x\\ &=\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} \cdot \frac{\Gamma(a+2) \Gamma(b)}{\Gamma(a+b+2)} \\ &=\frac{a(a+1)}{(a+b)(a+b+1)} \end{aligned} \]

\[\begin{aligned} \operatorname{Var}(X)&=\frac{a(a+1)}{(a+b)(a+b+1)}-\left(\frac{a}{a+b}\right)^{2}\\ &=\frac{a b}{(a+b)^{2}(a+b+1)} \end{aligned} \]

上一篇:【opencv】关于调整对比度与亮度的视觉算法


下一篇:推荐系统公平性论文阅读(四)