hazard function
定义如下:
λ
(
t
)
=
lim
h
→
0
+
P
(
t
≤
T
≤
t
+
h
∣
T
≥
t
)
h
\lambda(t)=\lim _{h \rightarrow 0^{+}} \frac{P(t \leq T \leq t+h \mid T \geq t)}{h}
λ(t)=h→0+limhP(t≤T≤t+h∣T≥t)
其中,
T
T
T 是生存时间。
λ
(
t
)
\lambda(t)
λ(t) 可以被认为是当病人已经活到了时间点
t
t
t 后(
T
≥
t
T \geq t
T≥t),在一个极短的时间
(
t
,
t
+
h
)
(t, t+h)
(t,t+h) 内死亡的概率。
f ( t ) f(t) f(t):表示在时间 t t t 时刻发生, f ( t ) f(t) f(t) 为 T T T 的概率密度函数, F ( t ) F(t) F(t) 为 T T T 的累积分布函数
λ ( t ) \lambda(t) λ(t):hazard function
F ( t ) F(t) F(t):存活时间低于 t t t 的概率
S ( t ) S(t) S(t):表示 t t t 时间段之后还存活的概率, S ( t ) = 1 − F ( t ) S(t)=1-F(t) S(t)=1−F(t)
推导如下:
λ
(
t
)
=
lim
h
→
0
+
P
(
t
≤
T
≤
t
+
h
∣
T
≥
t
)
h
=
1
P
(
T
≥
t
)
lim
h
→
0
+
P
(
t
≤
T
≤
t
+
h
)
h
=
1
P
(
T
≥
t
)
lim
h
→
0
+
P
(
T
≤
t
+
h
)
−
P
(
T
<
t
)
h
=
f
(
t
)
S
(
t
)
\begin{aligned} \lambda(t)&=\lim _{h \rightarrow 0^{+}} \frac{P(t \leq T \leq t+h \mid T \geq t)}{h} \\ &=\frac{1}{P(T \geq t)} \lim _{h \rightarrow 0^{+}} \frac{P(t \leq T \leq t+h)}{h} \\ &=\frac{1}{P(T \geq t)} \lim _{h \rightarrow 0^{+}} \frac{P(T \leq t+h)-P(T \lt t)}{h} \\ &=\frac{f(t)}{S(t)} \end{aligned}
λ(t)=h→0+limhP(t≤T≤t+h∣T≥t)=P(T≥t)1h→0+limhP(t≤T≤t+h)=P(T≥t)1h→0+limhP(T≤t+h)−P(T<t)=S(t)f(t)
= f ( t ) f(t) f(t):根据概率密度函数的定义
因为存活函数(Survival Function):
P
(
T
≥
t
)
=
S
(
t
)
=
1
−
P
(
T
<
t
)
=
1
−
F
(
t
)
P(T≥t)=S(t)=1-P(T \lt t)=1-F(t)
P(T≥t)=S(t)=1−P(T<t)=1−F(t)
则有:
λ
(
t
)
=
f
(
t
)
S
(
t
)
=
−
d
d
t
log
(
S
(
t
)
)
=
1
S
(
t
)
(
−
d
d
t
(
1
−
F
(
t
)
)
)
\begin{aligned} \lambda(t)&=\frac{f(t)}{S(t)} \\ &=-\frac{d}{d t} \log (S(t)) \\ &=\frac{1}{S(t)}(-\frac{d}{dt}(1-F(t))) \end{aligned}
λ(t)=S(t)f(t)=−dtdlog(S(t))=S(t)1(−dtd(1−F(t)))
ref:https://zhuanlan.zhihu.com/p/97501833