鞅和鞅的停时定理

一些定义:

  • 随机过程:依赖于参数的一组随机变量的全体,参数通常是时间。即假设 T T T 是指标集,且对于任意 t ∈ T t\in T t∈T, X t X_t Xt​ 都是一随机变量,那么我们就可以称 { X t ∣ t ∈ T } \{X_t|t\in T\} {Xt​∣t∈T} 为一随机过程。
  • 条件概率: P ( A ∣ B ) P(A|B) P(A∣B),表示事件 A A A 在事件 B B B 发生的条件下发生的概率。
  • 独立同分布:对于随机变量 X 1 , ⋯   , X n X_1,\cdots,X_n X1​,⋯,Xn​,若它们服从同一分布,并且互相独立,就称这些变量独立同分布。
  • V a r ( X ) Var(X) Var(X):为随机变量 X X X 的方差,等于 E ( ( X − E ( X ) ) 2 ) E((X-E(X))^2) E((X−E(X))2),展开后也等于 E ( X 2 ) − E ( X ) 2 E(X^2)-E(X)^2 E(X2)−E(X)2。

接下来介绍鞅的定义,一种最基础的鞅的定义是:

称离散随机过程 { X 0 , X 1 , ⋯   } \{X_0,X_1,\cdots\} {X0​,X1​,⋯} 是鞅,若对于任意的 n n n 都满足:

  • E ( ∣ X n ∣ ) < ∞ E(|X_n|)<\infty E(∣Xn​∣)<∞。

  • E ( X n + 1 ∣ X n , ⋯   , X 0 ) = X n E(X_{n+1}|X_n,\cdots,X_0)=X_n E(Xn+1​∣Xn​,⋯,X0​)=Xn​。

    这里 X n , ⋯   , X 0 X_n,\cdots,X_0 Xn​,⋯,X0​ 作为条件概率里的条件,意思是假设随机变量 X n , ⋯   , X 0 X_n,\cdots,X_0 Xn​,⋯,X0​ 已经确定了。即其等价于: ∀ x 0 , x 1 , ⋯   , x n , E ( X n + 1 ∣ X n = x n , ⋯   , X 0 = x 0 ) = X n \forall x_0,x_1,\cdots,x_n,E(X_{n+1}|X_n=x_{n},\cdots,X_0=x_0)=X_n ∀x0​,x1​,⋯,xn​,E(Xn+1​∣Xn​=xn​,⋯,X0​=x0​)=Xn​。

一个扩展一点的定义:

称离散随机过程 { Y 0 , Y 1 , ⋯   } \{Y_0,Y_1,\cdots\} {Y0​,Y1​,⋯} 关于随机过程 { X 0 , X 1 , ⋯   } \{X_0,X_1,\cdots\} {X0​,X1​,⋯} 是鞅,若对于任意的 n n n 都满足:

  • E ( ∣ Y n ∣ ) < ∞ E(|Y_n|)<\infty E(∣Yn​∣)<∞。
  • E ( Y n + 1 ∣ X n , ⋯   , X 0 ) = Y n E(Y_{n+1}|X_n,\cdots,X_0)=Y_n E(Yn+1​∣Xn​,⋯,X0​)=Yn​。

注意,第二个条件意味着 Y n Y_n Yn​ 仅可能与 X n , ⋯   , X 0 X_n,\cdots,X_0 Xn​,⋯,X0​ 有关,即在 X n , ⋯   , X 0 X_n,\cdots,X_0 Xn​,⋯,X0​ 确定的情况下, Y n Y_n Yn​ 也是确定的。

观察鞅的定义,我们可以得到这么一个结论:假设 Y n Y_n Yn​ 是关于 X n X_n Xn​ 的鞅,那么 ∀ t , E ( Y t ) = E ( Y 0 ) \forall t,E(Y_t)=E(Y_0) ∀t,E(Yt​)=E(Y0​)。

但注意这个结论并不和鞅定义中第二个条件等价,鞅定义中的第二个条件会比这个结论更加严格。

除此之外还有上鞅和下鞅:如果鞅的第二个条件中的符号变为 $\leq $ 则称其为上鞅;如果变为 ≥ \geq ≥,则称其为下鞅。注意这和 “上”、“下” 的直觉相反。

一道例题:

考虑一个简单的随机游走过程,即 S n = ∑ k = 1 n X k S_n=\sum_{k=1}^nX_k Sn​=∑k=1n​Xk​,且 P ( X i = 1 ) = P ( X i = − 1 ) = 1 2 P(X_i=1)=P(X_i=-1)=\frac{1}{2} P(Xi​=1)=P(Xi​=−1)=21​。

  1. 求证: S n S_n Sn​ 是一个关于 X n X_n Xn​ 的鞅。

    证明:第一个条件: E ( ∣ S n ∣ ) ≤ n < ∞ E(|S_n|)\leq n<\infty E(∣Sn​∣)≤n<∞。

    第二个条件: E ( S n + 1 − S n ∣ X n , ⋯   , X 0 ) = E ( X n + 1 ∣ X n , ⋯   , X 0 ) = E ( X n + 1 ) = 0 E(S_{n+1}-S_n|X_n,\cdots,X_0)=E(X_{n+1}|X_n,\cdots,X_0)=E(X_{n+1})=0 E(Sn+1​−Sn​∣Xn​,⋯,X0​)=E(Xn+1​∣Xn​,⋯,X0​)=E(Xn+1​)=0。

  2. 求证: Y n = S n 2 − n Y_n=S_n^2-n Yn​=Sn2​−n 是一个关于 X n X_n Xn​ 的鞅。

    证明:第一个条件: E ( ∣ S n 2 − n ∣ ) ≤ E ( S n 2 ) ≤ n 2 < ∞ E(|S_n^2-n|)\leq E(S_n^2)\leq n^2<\infty E(∣Sn2​−n∣)≤E(Sn2​)≤n2<∞。第二个条件:
    E ( Y n + 1 − Y n ∣ X n , ⋯   , X 0 ) = E ( ( S n + 1 2 − ( n + 1 ) ) − ( S n 2 − n ) ∣ X n , ⋯   , X 0 ) = E ( S n + 1 2 − S n 2 − 1 ∣ X n , ⋯   , X 0 ) = 1 2 ( ( S n + 1 ) 2 + ( S n − 1 ) 2 ) − S n 2 − 1 = 0 \begin{aligned} &E(Y_{n+1}-Y_{n}|X_n,\cdots,X_0)\\ =&E((S_{n+1}^2-(n+1))-(S_n^2-n)|X_n,\cdots,X_0)\\ =&E(S_{n+1}^2-S_n^2-1|X_n,\cdots,X_0)\\ =&\tfrac{1}{2}((S_n+1)^2+(S_n-1)^2)-S_n^2-1\\ =&0 \end{aligned} ====​E(Yn+1​−Yn​∣Xn​,⋯,X0​)E((Sn+12​−(n+1))−(Sn2​−n)∣Xn​,⋯,X0​)E(Sn+12​−Sn2​−1∣Xn​,⋯,X0​)21​((Sn​+1)2+(Sn​−1)2)−Sn2​−10​

鞅的停时定理

一些定义:

  • 几乎一定:一个事件 A A A 几乎一定会发生当且仅当事件 A A A 发生的概率为 1 1 1。即 A A A 不发生的情况集合可能是非空的,但它们对应的概率为 0 0 0。在样本空间有限时,“几乎一定” 和 “一定” 通常没有区别。但在样本空间无限时,这种区别变得非常重要,因为无限集可以有出现概率为 0 0 0 的非空子集。

    例子:在 [ 0 , 1 ] [0,1] [0,1] 中任选一个实数,选出的数几乎一定大于 0 0 0。

    下面可能还要注意 “趋近于” 和 “等于” 的区别:比如 0 0 0 乘任何数一定是 0 0 0(注意 ∞ \infty ∞ 不是 “数”),但一个趋近于 0 0 0 的数乘上一个趋近于 ∞ \infty ∞ 的数我们不知道它是什么。

  • 停时:关于随机过程 { X 0 , X 1 , ⋯   } \{X_0,X_1,\cdots\} {X0​,X1​,⋯} 的停时是一个非负的随机变量 T T T(可能为 ∞ \infty ∞),满足对于任意的 n n n, [ n = T ] [n=T] [n=T] 的取值仅与 X 0 , ⋯   , X n X_0,\cdots,X_n X0​,⋯,Xn​ 有关。直观地说,对于任意的时间 n n n,你可以仅通过 X 0 , ⋯   , X n X_0,\cdots,X_n X0​,⋯,Xn​ 判断 T , n T,n T,n 的大小关系(当然若 T ≤ n T\leq n T≤n,你也可以得到 T T T 的具体取值)。

  • 带停时的随机过程:对于随机过程 { X 0 , X 1 , ⋯   , } \{X_0,X_1,\cdots,\} {X0​,X1​,⋯,},设其停时为 T T T,定义该随机过程所对应的带停时的随机过程 { X ˉ 0 , X ˉ 1 , ⋯   } \{\bar X_0,\bar X_1,\cdots\} {Xˉ0​,Xˉ1​,⋯}:
    X ˉ n = { X n , n ≤ T X T , n > T \bar X_n= \begin{cases} X_n,&n\leq T\\ X_T,&n>T \end{cases} Xˉn​={Xn​,XT​,​n≤Tn>T​
    当然,一些文章中可能会直接用 X min ⁡ ( n , T ) X_{\min(n,T)} Xmin(n,T)​ 代替 X ˉ n \bar X_n Xˉn​。

    直观地说, { X ˉ 0 , X ˉ 1 , ⋯   } \{\bar X_0,\bar X_1,\cdots\} {Xˉ0​,Xˉ1​,⋯} 就是把 { X 0 , X 1 , ⋯   } \{X_0,X_1,\cdots\} {X0​,X1​,⋯} 改成在停时之后维持不变的结果。

    注意停时 T T T 只是一个关于 { X 0 , X 1 , ⋯   , } \{X_0,X_1,\cdots,\} {X0​,X1​,⋯,} 的函数,并不是说一个随机过程有停时它就是带停时的。

我们可以证明某个鞅带停时后也是一个鞅:

  • 引理 1:设 Y n Y_n Yn​ 是一个关于 X n X_n Xn​ 的鞅,那么 Y ˉ n \bar Y_n Yˉn​ 也是一个关于 X n X_n Xn​ 的鞅。

    证明:我们只需要证明 E ( Y ˉ n + 1 ∣ X n , ⋯   , X 0 ) = Y ˉ n E(\bar Y_{n+1}|X_n,\cdots,X_0)=\bar Y_n E(Yˉn+1​∣Xn​,⋯,X0​)=Yˉn​ 即可。

    注意 X n , ⋯   , X 0 X_n,\cdots,X_0 Xn​,⋯,X0​ 是已知的,所以我们可以得到 T , n T,n T,n 的大小关系:

    • 若 T ≤ n T\leq n T≤n,则 Y ˉ n + 1 = Y ˉ n \bar Y_{n+1}=\bar Y_n Yˉn+1​=Yˉn​。
    • 若 T > n T>n T>n,则 E ( Y ˉ n + 1 ∣ X n , ⋯   , X 0 ) = E ( Y n + 1 ∣ X n , ⋯   , X 0 ) = Y n = Y ˉ n E(\bar Y_{n+1}|X_n,\cdots,X_0)=E(Y_{n+1}|X_n,\cdots,X_0)=Y_n=\bar Y_{n} E(Yˉn+1​∣Xn​,⋯,X0​)=E(Yn+1​∣Xn​,⋯,X0​)=Yn​=Yˉn​。

    直观地说,对于那些未到停时的过程它们原来就是期望不变的,对于那些已经到停时的过程由于我们已经钦定它们不变了,所以它们也是期望不变的。

    推论: ⋯ = E ( Y ˉ 1 ) = E ( Y ˉ 0 ) = E ( Y 0 ) = E ( Y 1 ) = ⋯ \cdots=E(\bar Y_1) =E(\bar Y_0)=E(Y_0)=E(Y_1)=\cdots ⋯=E(Yˉ1​)=E(Yˉ0​)=E(Y0​)=E(Y1​)=⋯。直观上也很容易解释。

接下来介绍鞅的停时定理:

设 { Y 0 , Y 1 , ⋯   } \{Y_0,Y_1,\cdots\} {Y0​,Y1​,⋯} 是一个鞅, T T T 是其停时,且 T T T 几乎一定有限( P ( T < ∞ ) = 1 P(T<\infty)=1 P(T<∞)=1),若有下列条件之一成立,则有 E ( Y T ) = E ( Y 0 ) E(Y_T)=E(Y_0) E(YT​)=E(Y0​):

  • T T T 几乎一定有界,即存在一个常数 K K K 使得 P ( T ≤ K ) = 1 P(T\leq K)=1 P(T≤K)=1。

    证明:
    E ( Y T ) = P ( T ≤ K ) E ( Y T ∣ T ≤ K ) + P ( T > K ) E ( Y T ∣ T > k ) = E ( Y T ∣ T ≤ K ) = E ( Y ˉ K ) = E ( Y 0 ) : \begin{aligned} E(Y_T)&=P(T\leq K)E(Y_T|T\leq K)+P(T>K)E(Y_T|T>k)\\ &=E(Y_T|T\leq K)\\ &=E(\bar Y_K)\\ &=E(Y_0) \end{aligned}: E(YT​)​=P(T≤K)E(YT​∣T≤K)+P(T>K)E(YT​∣T>k)=E(YT​∣T≤K)=E(YˉK​)=E(Y0​)​:
    一些帮助理解的例子:

    • 数轴上从 0 0 0 开始向右游走,每次走长度 1 1 1 或长度 2 2 2,走到当前位置大于等于特定常数 S S S 为止。这个是 T T T 有界的例子。
    • 从 [ 0 , 1 ] [0,1] [0,1] 中每次随机选一个实数,直到选出非 0 0 0 数为止。这是 T T T 不有界但几乎一定有界的例子。
    • 每次抛一枚硬币,直到抛出反面位置。这是 T T T 不几乎一定有界的例子。因为对于任意的 K K K, P ( T > K ) = 1 2 K P(T>K)=\frac{1}{2^K} P(T>K)=2K1​,而即使是 K K K 趋近于 ∞ \infty ∞ 时, P ( T > K ) P(T>K) P(T>K) 也只是趋近于 0 0 0,而不等于 0 0 0。
  • Y ˉ n \bar Y_n Yˉn​ 几乎一定有界,即存在一个常数 K K K 使得 P ( ∣ Y ˉ n ∣ ≤ K ) = 1 P(|\bar Y_n|\leq K)=1 P(∣Yˉn​∣≤K)=1。

    证明:
    E ( Y T ) = lim ⁡ n → ∞ P ( T ≤ n ) E ( Y T ∣ T ≤ n ) + P ( T > n ) E ( Y T ∣ T > n ) = lim ⁡ n → ∞ P ( T ≤ n ) E ( Y ˉ n ∣ T ≤ n ) + P ( T > n ) ⋅ O ( 1 ) = lim ⁡ n → ∞ P ( T ≤ n ) E ( Y ˉ n ∣ T ≤ n ) = lim ⁡ n → ∞ E ( Y ˉ n ) − P ( T > n ) E ( Y ˉ n ∣ T > n ) = lim ⁡ n → ∞ E ( Y ˉ n ) − P ( T > n ) ⋅ O ( 1 ) = lim ⁡ n → ∞ E ( Y ˉ n ) = E ( Y 0 ) \begin{aligned} E(Y_T)&=\lim_{n\to \infty}P(T\leq n)E(Y_T|T\leq n)+P(T>n)E(Y_T|T>n)\\ &=\lim_{n\to \infty}P(T\leq n)E(\bar Y_n|T\leq n)+P(T>n)\cdot O(1)\\ &=\lim_{n\to \infty}P(T\leq n)E(\bar Y_n|T\leq n)\\ &=\lim_{n\to \infty}E(\bar Y_n)-P(T>n)E(\bar Y_n|T>n)\\ &=\lim_{n\to \infty}E(\bar Y_n)-P(T>n)\cdot O(1)\\ &=\lim_{n\to \infty}E(\bar Y_n)\\ &=E(Y_0) \end{aligned} E(YT​)​=n→∞lim​P(T≤n)E(YT​∣T≤n)+P(T>n)E(YT​∣T>n)=n→∞lim​P(T≤n)E(Yˉn​∣T≤n)+P(T>n)⋅O(1)=n→∞lim​P(T≤n)E(Yˉn​∣T≤n)=n→∞lim​E(Yˉn​)−P(T>n)E(Yˉn​∣T>n)=n→∞lim​E(Yˉn​)−P(T>n)⋅O(1)=n→∞lim​E(Yˉn​)=E(Y0​)​
    一些帮助理解的例子:

    • 数轴上从 0 0 0 开始随机游走,每次等概率向左或向右移动 1 1 1,走到 − m -m −m 或 m m m 为止。那么第 n n n 步之后的位置 S n S_n Sn​ 肯定有界 [ − m , m ] [-m,m] [−m,m]。
  • E ( T ) E(T) E(T) 有限。且 E ( ∣ Y n + 1 − Y n ∣ ) E(|Y_{n+1}-Y_n|) E(∣Yn+1​−Yn​∣) 几乎一定有界,即存在一个常数 K K K 使得 P ( E ( ∣ Y n + 1 − Y n ∣ ) ≤ K ) = 1 P(E(|Y_{n+1}-Y_n|)\leq K)=1 P(E(∣Yn+1​−Yn​∣)≤K)=1。

    证明:
    lim ⁡ t → ∞ E ( Y T − Y t ) = lim ⁡ t → ∞ P ( T > t ) E ( Y T − Y t ∣ T > t ) = lim ⁡ t → ∞ ∑ i = t ∞ P ( T > i ) E ( Y i + 1 − Y i ∣ T > i ) ≤ lim ⁡ t → ∞ ∑ i = t ∞ P ( T > i ) K = K lim ⁡ t → ∞ ∑ i = t ∞ P ( T > i ) = K lim ⁡ t → ∞ ∑ i = t ∞ P ( T = i ) ( i − t ) ≤ K lim ⁡ t → ∞ ∑ i = t ∞ P ( T = i ) i \begin{aligned} &\lim_{t\to \infty}E(Y_T-Y_t)\\ =&\lim_{t\to \infty}P(T>t)E(Y_T-Y_t|T>t)\\ =&\lim_{t\to \infty}\sum_{i=t}^{\infty}P(T>i)E(Y_{i+1}-Y_i|T>i)\\ \leq &\lim_{t\to \infty}\sum_{i=t}^{\infty}P(T>i)K\\ =&K\lim_{t\to\infty}\sum_{i=t}^{\infty}P(T>i)\\ =&K\lim_{t\to \infty}\sum_{i=t}^{\infty}P(T=i)(i-t)\\ \leq &K\lim_{t\to \infty}\sum_{i=t}^{\infty}P(T=i)i\\ \end{aligned} ==≤==≤​t→∞lim​E(YT​−Yt​)t→∞lim​P(T>t)E(YT​−Yt​∣T>t)t→∞lim​i=t∑∞​P(T>i)E(Yi+1​−Yi​∣T>i)t→∞lim​i=t∑∞​P(T>i)KKt→∞lim​i=t∑∞​P(T>i)Kt→∞lim​i=t∑∞​P(T=i)(i−t)Kt→∞lim​i=t∑∞​P(T=i)i​
    考虑设 S n = ∑ i = 0 n P ( T = i ) i S_n=\sum_{i=0}^nP(T=i)i Sn​=∑i=0n​P(T=i)i,显然数列 S n S_n Sn​ 趋近于数 E ( T ) E(T) E(T),那么 E ( T ) − S n E(T)-S_n E(T)−Sn​ 趋近于 0 0 0,所以上式等于 0 0 0。故:
    E ( Y T ) = lim ⁡ t → ∞ E ( Y t ) = E ( Y 0 ) E(Y_T)=\lim_{t\to \infty}E(Y_t)=E(Y_0) E(YT​)=t→∞lim​E(Yt​)=E(Y0​)
    一些帮助理解的例子:

    • 首先注意前提条件中的 P ( T < ∞ ) = 1 P(T<\infty)=1 P(T<∞)=1 并不代表着 E ( T ) < ∞ E(T)<\infty E(T)<∞。比如我们这么构造停时为 i i i 的概率: P ( T = i ) = p i = 6 π 2 ⋅ 1 i 2 P(T=i)=p_i=\frac{6}{\pi^2}\cdot \frac{1}{i^2} P(T=i)=pi​=π26​⋅i21​,显然 ∑ i ≥ 0 p i \sum_{i\geq 0}p_i ∑i≥0​pi​ 收敛于 1 1 1,所以 P ( T < ∞ ) = 1 P(T<\infty)=1 P(T<∞)=1。但如果我们要求 E ( T ) = ∑ i ≥ 0 p i i = 6 π 2 ∑ i ≥ 0 1 i E(T)=\sum_{i\geq 0}p_ii=\frac{6}{\pi^2}\sum_{i\geq 0}\frac{1}{i} E(T)=∑i≥0​pi​i=π26​∑i≥0​i1​,会发现它并不收敛,而是发散的。

讲一个应用的例子吧:

CF1349D Slime and Biscuits

题意:

有 n n n 个人,每个人拥有 A i A_i Ai​ 块饼干。

每次随机将一块饼干等概率分给除了其所有者以外的人。

求第一次出现有一个人拥有所有饼干的所需的期望次数。

做法:

停时与 a a a 序列有关,我们考虑构造一个鞅,同时携带了 A A A 序列和时间这两个信息。

我们大胆地猜想,我们可以构造一个关于 A A A 序列的函数 F ( A ) F(A) F(A) 使得 Y t = F ( A t ) + t Y_t=F(A_t)+t Yt​=F(At​)+t 为鞅。进一步的猜想是令 F ( A ) = ∑ i = 1 n f ( a i ) F(A)=\sum_{i=1}^nf(a_i) F(A)=∑i=1n​f(ai​)。

那么我们就需要满足:
E ( Y t + 1 − Y t ∣ A t ) = 0 E(Y_{t+1}-Y_t|A_t)=0 E(Yt+1​−Yt​∣At​)=0
展开后得到:
1 + ∑ i = 1 n ( m − A t , i m ⋅ n − 2 n − 1 − 1 ) f ( A t , i ) + A t , i m f ( A t , i − 1 ) + m − A t , i m ⋅ 1 n − 1 f ( A t , i + 1 ) = 0 1+\sum_{i=1}^n\left(\frac{m-A_{t,i}}{m}\cdot \frac{n-2}{n-1}-1\right)f(A_{t,i})+\frac{A_{t,i}}{m}f(A_{t,i}-1)+\frac{m-A_{t,i}}{m}\cdot \frac{1}{n-1}f(A_{t,i}+1)=0 1+i=1∑n​(mm−At,i​​⋅n−1n−2​−1)f(At,i​)+mAt,i​​f(At,i​−1)+mm−At,i​​⋅n−11​f(At,i​+1)=0
一个技巧是把 1 1 1 拆到里面去:
∑ i = 1 n ( m − A t , i m ⋅ n − 2 n − 1 − 1 ) f ( A t , i ) + A t , i m f ( A t , i − 1 ) + m − A t , i m ⋅ 1 n − 1 f ( A t , i + 1 ) + A t , i m = 0 \sum_{i=1}^n\left(\frac{m-A_{t,i}}{m}\cdot \frac{n-2}{n-1}-1\right)f(A_{t,i})+\frac{A_{t,i}}{m}f(A_{t,i}-1)+\frac{m-A_{t,i}}{m}\cdot \frac{1}{n-1}f(A_{t,i}+1)+\frac{A_{t,i}}{m}=0 i=1∑n​(mm−At,i​​⋅n−1n−2​−1)f(At,i​)+mAt,i​​f(At,i​−1)+mm−At,i​​⋅n−11​f(At,i​+1)+mAt,i​​=0
注意到这个式子对于 A t A_t At​ 为任意序列都成立,所以为了不失一般性,我们应该令:
( m − x m ⋅ n − 2 n − 1 − 1 ) f ( x ) + x m f ( x − 1 ) + m − x m ⋅ 1 n − 1 f ( x + 1 ) + x m = 0 \left(\frac{m-x}{m}\cdot \frac{n-2}{n-1}-1\right)f(x)+\frac{x}{m}f(x-1)+\frac{m-x}{m}\cdot \frac{1}{n-1}f(x+1)+\frac{x}{m}=0 (mm−x​⋅n−1n−2​−1)f(x)+mx​f(x−1)+mm−x​⋅n−11​f(x+1)+mx​=0
对于任意的 x ∈ [ 0 , m ] x\in[0,m] x∈[0,m]。

解出 f f f 即可,可以做到 O ( m ) O(m) O(m)。那么 E ( T ) = E ( F ( A T ) + T ) − E ( F ( A T ) ) = E ( Y T ) − E ( F ( A T ) ) = E ( Y 0 ) − E ( F ( A T ) ) E(T)=E(F(A_T)+T)-E(F(A_T))=E(Y_T)-E(F(A_T))=E(Y_0)-E(F(A_T)) E(T)=E(F(AT​)+T)−E(F(AT​))=E(YT​)−E(F(AT​))=E(Y0​)−E(F(AT​)).

至于为什么这个鞅能用鞅的停时定理,我们可以发现它满足 E ( ∣ Y t + 1 − Y t ∣ ) E(|Y_{t+1}-Y_t|) E(∣Yt+1​−Yt​∣) 有界,但 E ( T ) < ∞ E(T)<\infty E(T)<∞ 这个我不会证。(但既然题目都让你求它了那它肯定就是有限的)

上一篇:8月24日 每日一题 787. K 站中转内最便宜的航班经典最短路线图论题目: BFS,DP, Dijkstra, Bellman-Ford, Bidirectional search


下一篇:力扣 746. 使用最小花费爬楼梯