survival analysis之hazard function推导

hazard function

定义如下:
λ ( t ) = lim ⁡ h → 0 + P ( t ≤ T ≤ t + h ∣ T ≥ t ) h \lambda(t)=\lim _{h \rightarrow 0^{+}} \frac{P(t \leq T \leq t+h \mid T \geq t)}{h} λ(t)=h→0+lim​hP(t≤T≤t+h∣T≥t)​
其中, T T T 是生存时间。 λ ( t ) \lambda(t) λ(t) 可以被认为是当病人已经活到了时间点 t t t 后( T ≥ t T \geq t T≥t),在一个极短的时间 ( t , t + h ) (t, t+h) (t,t+h) 内死亡的概率。

f ( t ) f(t) f(t):表示在时间 t t t 时刻发生​, f ( t ) f(t) f(t) 为 T T T 的概率密度函数, F ( t ) F(t) F(t) 为 T T T 的累积分布函数

λ ( t ) \lambda(t) λ(t):hazard function

F ( t ) F(t) F(t):存活时间低于 t t t 的概率

S ( t ) S(t) S(t):表示 t t t 时间段之后还存活的概率, S ( t ) = 1 − F ( t ) S(t)=1-F(t) S(t)=1−F(t)

推导如下:
λ ( t ) = lim ⁡ h → 0 + P ( t ≤ T ≤ t + h ∣ T ≥ t ) h = 1 P ( T ≥ t ) lim ⁡ h → 0 + P ( t ≤ T ≤ t + h ) h = 1 P ( T ≥ t ) lim ⁡ h → 0 + P ( T ≤ t + h ) − P ( T < t ) h = f ( t ) S ( t ) \begin{aligned} \lambda(t)&=\lim _{h \rightarrow 0^{+}} \frac{P(t \leq T \leq t+h \mid T \geq t)}{h} \\ &=\frac{1}{P(T \geq t)} \lim _{h \rightarrow 0^{+}} \frac{P(t \leq T \leq t+h)}{h} \\ &=\frac{1}{P(T \geq t)} \lim _{h \rightarrow 0^{+}} \frac{P(T \leq t+h)-P(T \lt t)}{h} \\ &=\frac{f(t)}{S(t)} \end{aligned} λ(t)​=h→0+lim​hP(t≤T≤t+h∣T≥t)​=P(T≥t)1​h→0+lim​hP(t≤T≤t+h)​=P(T≥t)1​h→0+lim​hP(T≤t+h)−P(T<t)​=S(t)f(t)​​

= f ( t ) f(t) f(t):根据概率密度函数的定义

因为存活函数(Survival Function):
P ( T ≥ t ) = S ( t ) = 1 − P ( T < t ) = 1 − F ( t ) P(T≥t)=S(t)=1-P(T \lt t)=1-F(t) P(T≥t)=S(t)=1−P(T<t)=1−F(t)

则有:
λ ( t ) = f ( t ) S ( t ) = − d d t log ⁡ ( S ( t ) ) = 1 S ( t ) ( − d d t ( 1 − F ( t ) ) ) \begin{aligned} \lambda(t)&=\frac{f(t)}{S(t)} \\ &=-\frac{d}{d t} \log (S(t)) \\ &=\frac{1}{S(t)}(-\frac{d}{dt}(1-F(t))) \end{aligned} λ(t)​=S(t)f(t)​=−dtd​log(S(t))=S(t)1​(−dtd​(1−F(t)))​


ref:https://zhuanlan.zhihu.com/p/97501833

上一篇:vscode remote ssh 免密码步骤


下一篇:模型评价——C-index