对泊松分布的一点理解
如题,自从知道(或者说听说更恰当)了泊松分布之后,就一直很奇怪它的原理。所以找了一些资料来帮助理解。
果然,像老师说的那样:概率统计并不好学,觉得简单的人只不过是还没有完全掌握。
泊松分布和二项分布
泊松分布和二项分布之间有极限近似关系,就说明它们之间一定存在着一些本质上的联系:
二项分布是说,已知某件事情发生的概率是p,那么做n次实验,事情发生的次数就服从二项分布。
泊松分布是指,某段连续的时间内某件事情发生的次数。而在这个情形下,“某件事情”发生所用的时间是可以忽略的。例如, 5 m i n 5min 5min内电子元件遭受脉冲的次数,就服从于泊松分布。
Poisson分布的两种定义
要讨论Poisson分布的本质,不妨从它的定义入手
定义一
一个随机变量X,只能取非负整数(X = 0, 1, 2, …),且相应的概率为
e
−
λ
λ
x
x
!
e^{-\lambda}\frac{\lambda ^x}{x!}
e−λx!λx
则称该变量服从Poisson分布。
这个定义就是我们平时考试或者理论工作时用的Poisson随机变量的定义
定义二(Poisson Process的定义)
假定一个事件在一段时间内随即发生,且符合以下条件:
- 将该时间段无限分割成若干个小的时间段,在这个接近于零的小时间段内,该事件发生一次的概率于这个极小时间段的长度成正比。
- 在每一个极小时间段内,该事件发生两次及以上的概率恒等于零。
- 该事件在不同的小时间段里,发生与否相互独立。
则该事件称为Poisson Process。
为什么现实生活中的情况(例如医院的例子)会服从Poisson分布的第一定义?
以第二定义作为桥梁,就容易理解了。在现实生活中的情况,如果事件是相互独立的,那么很容易就能符合Poisson分布的第二定义,因此也就符合Poisson分布
公式的推导
将一段时间
T
T
T做划分,等分为
n
n
n份。假设在每一段时间内,事件发生的概率为
p
p
p。则在
T
T
T时间内,事件发生
k
k
k次的概率为:
lim
n
→
∞
C
n
k
p
k
(
1
−
p
)
n
−
k
(1)
\lim_{n\to \infty}C^k_np^k(1-p)^{n-k}\tag1
n→∞limCnkpk(1−p)n−k(1)
这里的概率
p
p
p需要求解,方法如下:
显然
(
1
)
(1)
(1)式服从二项分布,二项分布的期望为:
E
(
X
)
=
n
p
=
λ
E(X)=np=\lambda
E(X)=np=λ
那么:
p
=
λ
n
(2)
p = \frac{\lambda}{n}\tag2
p=nλ(2)
将
(
2
)
(2)
(2)式回代入
(
1
)
(1)
(1)式,得到:
lim
n
→
∞
C
n
k
p
k
(
1
−
p
)
n
−
k
=
lim
n
→
∞
C
n
k
(
λ
n
)
k
(
1
−
λ
n
)
n
−
k
(3)
\lim_{n\to \infty}C^k_np^k(1-p)^{n-k}=\lim_{n\to \infty}C^k_n(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k}\tag3
n→∞limCnkpk(1−p)n−k=n→∞limCnk(nλ)k(1−nλ)n−k(3)
计算
(
3
)
(3)
(3)式的极限,得:
lim
n
→
∞
C
n
k
(
λ
n
)
k
(
1
−
λ
n
)
n
−
k
=
e
−
λ
λ
k
k
!
\lim_{n\to \infty}C^k_n(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k}=e^{-\lambda}\frac{\lambda ^k}{k!}
n→∞limCnk(nλ)k(1−nλ)n−k=e−λk!λk
这就是Poisson分布得概率密度函数,即
P
(
X
=
k
)
=
e
−
λ
λ
k
k
!
P(X = k)=e^{-\lambda}\frac{\lambda ^k}{k!}
P(X=k)=e−λk!λk
其中
λ
=
n
p
\lambda = np
λ=np
泊松分布是二项分布n很大而p很小时的一种极限形式
二项分布:KaTeX parse error: \tag works only in display equations
泊松分布: lim n → ∞ C n k p k ( 1 − p ) n − k = lim n → ∞ C n k ( λ n ) k ( 1 − λ n ) n − k = e − λ λ k k ! \lim_{n\to \infty}C^k_np^k(1-p)^{n-k}=\lim_{n\to \infty}C^k_n(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k}=e^{-\lambda}\frac{\lambda ^k}{k!} limn→∞Cnkpk(1−p)n−k=limn→∞Cnk(nλ)k(1−nλ)n−k=e−λk!λk
其中 n p = λ np=\lambda np=λ,且在泊松分布里 n → ∞ n\to \infty n→∞很大,而 p = λ n p = \frac{\lambda}{n} p=nλ很小