【鞅与停时】停时理论

停时

Stopping time

{Xn,n0} 是一个随机变量序列,称随机函数T是关于过程 {Xn,n0} 的停时,如果

  1. T{0,1,2,,} 上取值;
  2. 对每一个n0{T=n}σ(X0,X1,,Xn)

例如确定时刻 T=n,首达时刻 T(A)=inf{n,XnA} 都为停时。

定义说明停时 T 仅能依靠 n 时刻及之前的信息确定。即赌博者仅仅以过去的输赢判断,因此不能采用“下一局赢了就停止赌博”的策略作为停时。

Stopping Time Theorem

有时也称作Optional Stopping Theorem,强调停时的“可选性”(即停时策略的自主性),一般无需区分

在时间被“停止”后,鞅的性质是否会发生显著变化?

Theorem

Mn 是一个上鞅,T 是满足 P(T<)=1 的停时,则以下结论成立:

  1. MTn 仍然是上鞅;
  2. 特别地,有 E(MTn)E(M0)

Tn=min{T,n},上述定理改为鞅/下鞅对应结论(E(MTn)=,E(M0))仍然成立。


为何有 MTn 的形式?原因在于对于鞅 Mn,不能保证得到 E(MT)=E(M0)

CounterExample

设随机序列 Sn=1+k=1nXk,Xk=±1 等概率发生。定义停时 T=min{n:Sn=0}
此时,尽管 Sn 是鞅,且 P{T<}=1,但 E(ST)=01=E(S0)

上述反例的关键点在于 P{T<}=1 but E{T}=(零常返,也可证明如下)

  1. 由于对称随机游走易知是常返的,因此有概率 1 回到任意整数点,即说明 P{T<}=1
  2. 设从状态 k 出发首次到达 0 的期望时间为 Ek[T],则有
Ek[T]=1+12Ek+1[T]+12Ek1[T]E1[T]=1+12E0[T]+12E2[T]

由对称性 E0[T]=E2[T] 可知 0=1+E0[T],矛盾!唯一解释为 E{T}=E1[T]=


这里列出相对更常用的定理:

Stopping Time Theorem

设 Xt 是鞅,τ 是停时,若满足以下条件,则 E[Xτ]=E[X0]

  1. 可积性:E[|Xτ|]<
  2. τ 的期望有限:E[τ]<

该定理有一些条件“相对更宽”的版本(比如在一些情况下期望有限等价于几乎必然有限),因为上述定理涵盖了大部分应用场景,这里不过多赘述。重点关注下面停时定理的应用。

停时定理的应用

通过例子说明停时定理的应用,关键在于构建鞅,确认可选停时定理成立的充分条件

比较首达时间的概率

X1, 是独立同分布的随机过程,且 P(Xi=1)=P(Xi=1)=12。设 Sn=x+k=1nXk, τ=min{n:Sn(a,b),a<x<b},试求解 Px(Va<Vb)

  1. 鞅的构造
    Sn=E[Sn+1|Fn] 是鞅
  2. 停时 τ,满足几乎必然有限
  3. 通过下式即可联立解得 Px(Va<Vb)=Px(Sτ=a)=bxba
E(ST)=aPx(Sτ=a)+bPx(Sτ=b)=x=E(S0)Px(Sτ=a)+Px(Sτ=b)=1

可见,通过构造鞅分析随机过程的趋势,从而避开复杂的路径依赖随机问题。

同上,修改概率 P(X=1)=p12,P(X=1)=1p,其余不变

这里 Sn 不再是一个鞅,按直观想法易构造鞅 SnnE{Xi}=Snn(pq) ,q=1p (对应上一个问题即 E{Xi}=0),根据停时定理有

E(Sτ)(2p1)E(τ)=x

但通常 E(τ) 是难以计算的,这里也是;一个自然的思路就是找到一个不会带来额外未知项的鞅 @ 指数鞅

  1. 构造指数鞅 Mn=(qp)Sn
  2. 解方程组
(qp)x=Ex(Mτ)=(qp)aPx(Sτ=a)+(qp)bPx(Sτ=b)Px(sτ=a)+Px(Sτ=b)=1
  1. Px(Va<Vb)=Px(Sτ=a)=(qp)b(qp)x(qp)b(qp)a
同上,计算 Ex(τ)
Ex(τ)=(Ex(Sτ)x)μ=xaqpbaqp(qp)x(qp)a(qp)b(qp)a E(Sτ2)E(τ)=E(M0)=x2a2bxba+b2(1bxba)E(τ)=x2E(τ)=x2+(a+b)xab=(xa)(xb)
停时的随机性质

考虑随机变量 Sn=S0+i=1nXi,其中 Xi 独立同分布,且 XiN(μ,σ2), μ>0, 研究 T=min{n:Sn0} 的随机性质

T 即等价于投资问题中的最近破产时间

  1. 通过 ϕ(θ)=E(eθX1)=eθ2σ22+θμ=1 构造鞅 Mn=eθSn,θ=2μ/σ2
  2. 然而 E{T} 并不有限,有 E(MTn)=E(M0)=eθS0
    Tn 分析有
E(MTn)=E(MT)I(Tn)+E(Mn)I(T>n)E(MT)I(Tn)E(I(Tn))=P(Tn)

n 即有 P(T<)eθS0=e2μS0/σ2

对于鞅,通常单边的首达时间期望无穷,而涵盖初始起点的区间的离出时间期望有限


© 2024 LiQ :) 由 Obsidian&Github 强力驱动