对泊松分布的一点理解

对泊松分布的一点理解

如题,自从知道(或者说听说更恰当)了泊松分布之后,就一直很奇怪它的原理。所以找了一些资料来帮助理解。

果然,像老师说的那样:概率统计并不好学,觉得简单的人只不过是还没有完全掌握。

泊松分布和二项分布

泊松分布和二项分布之间有极限近似关系,就说明它们之间一定存在着一些本质上的联系:

二项分布是说,已知某件事情发生的概率是p,那么做n次实验,事情发生的次数就服从二项分布。

泊松分布是指,某段连续的时间内某件事情发生的次数。而在这个情形下,“某件事情”发生所用的时间是可以忽略的。例如, 5 m i n 5min 5min内电子元件遭受脉冲的次数,就服从于泊松分布。

Poisson分布的两种定义

要讨论Poisson分布的本质,不妨从它的定义入手

定义一

一个随机变量X,只能取非负整数(X = 0, 1, 2, …),且相应的概率为
e − λ λ x x ! e^{-\lambda}\frac{\lambda ^x}{x!} e−λx!λx​
则称该变量服从Poisson分布。

这个定义就是我们平时考试或者理论工作时用的Poisson随机变量的定义

定义二(Poisson Process的定义)

假定一个事件在一段时间内随即发生,且符合以下条件:

  1. 将该时间段无限分割成若干个小的时间段,在这个接近于零的小时间段内,该事件发生一次的概率于这个极小时间段的长度成正比。
  2. 在每一个极小时间段内,该事件发生两次及以上的概率恒等于零。
  3. 该事件在不同的小时间段里,发生与否相互独立。

则该事件称为Poisson Process。

为什么现实生活中的情况(例如医院的例子)会服从Poisson分布的第一定义?

以第二定义作为桥梁,就容易理解了。在现实生活中的情况,如果事件是相互独立的,那么很容易就能符合Poisson分布的第二定义,因此也就符合Poisson分布

公式的推导

将一段时间 T T T做划分,等分为 n n n份。假设在每一段时间内,事件发生的概率为 p p p。则在 T T T时间内,事件发生 k k k次的概率为:
lim ⁡ n → ∞ C n k p k ( 1 − p ) n − k (1) \lim_{n\to \infty}C^k_np^k(1-p)^{n-k}\tag1 n→∞lim​Cnk​pk(1−p)n−k(1)
这里的概率 p p p需要求解,方法如下:

显然 ( 1 ) (1) (1)式服从二项分布,二项分布的期望为:
E ( X ) = n p = λ E(X)=np=\lambda E(X)=np=λ
那么:
p = λ n (2) p = \frac{\lambda}{n}\tag2 p=nλ​(2)
将 ( 2 ) (2) (2)式回代入 ( 1 ) (1) (1)式,得到:
lim ⁡ n → ∞ C n k p k ( 1 − p ) n − k = lim ⁡ n → ∞ C n k ( λ n ) k ( 1 − λ n ) n − k (3) \lim_{n\to \infty}C^k_np^k(1-p)^{n-k}=\lim_{n\to \infty}C^k_n(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k}\tag3 n→∞lim​Cnk​pk(1−p)n−k=n→∞lim​Cnk​(nλ​)k(1−nλ​)n−k(3)
计算 ( 3 ) (3) (3)式的极限,得:
lim ⁡ n → ∞ C n k ( λ n ) k ( 1 − λ n ) n − k = e − λ λ k k ! \lim_{n\to \infty}C^k_n(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k}=e^{-\lambda}\frac{\lambda ^k}{k!} n→∞lim​Cnk​(nλ​)k(1−nλ​)n−k=e−λk!λk​
这就是Poisson分布得概率密度函数,即
P ( X = k ) = e − λ λ k k ! P(X = k)=e^{-\lambda}\frac{\lambda ^k}{k!} P(X=k)=e−λk!λk​
其中 λ = n p \lambda = np λ=np

泊松分布是二项分布n很大而p很小时的一种极限形式

二项分布:KaTeX parse error: \tag works only in display equations

泊松分布: lim ⁡ n → ∞ C n k p k ( 1 − p ) n − k = lim ⁡ n → ∞ C n k ( λ n ) k ( 1 − λ n ) n − k = e − λ λ k k ! \lim_{n\to \infty}C^k_np^k(1-p)^{n-k}=\lim_{n\to \infty}C^k_n(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k}=e^{-\lambda}\frac{\lambda ^k}{k!} limn→∞​Cnk​pk(1−p)n−k=limn→∞​Cnk​(nλ​)k(1−nλ​)n−k=e−λk!λk​

其中 n p = λ np=\lambda np=λ,且在泊松分布里 n → ∞ n\to \infty n→∞很大,而 p = λ n p = \frac{\lambda}{n} p=nλ​很小

上一篇:泊松点过程Poisson-point-process


下一篇:如何在python中使用random.expovariate()生成整数间隔到达时间