大偏差理论关注概率分布序列的远端尾部的渐近行为,即关注与期望偏差较大,稀有事件的概率。更进一步,该理论关注某些极端事件或尾部事件的概率度量的指数下降。而型方法是研究该问题的强有力工具,Cover 书 中型方法用于计算稀有事件概率,通用信源编码存在性证明,以及假设检验中的应用。
Notations & Definitions
这里 Notation 定义参考文献 2,不影响理解
- : alphabet,一个字母表
- : 符号序列 组成的集合
可简记
- : infinite sequences set
- : all finite sequences set,include
型:样本数为 的经验概率分布
记
型类:序列长度为 且型为 的序列全体
如 ,则型的集合为 ,中每个元素为一种型
型的性质
为便于表示,上标 n 有时省略
若采样独立同分布,服从 (distribution on ),则 出现概率仅依赖于其型
同为上述例子 ,直观易知出现 010101
与 000111
概率其实一致,只与出现几个 1
,几个 0
有关

可以看出,上述定理表明,对于i.i.d.的采样,采样结果可以按照型类来划分,且同一型类下所有采样序列出现的概率一致,与 AEP 有类似之处。
- 对于 的大小,即 n-type 的种类个数,等价于将 n 个相同的球放入 个不同盒子最终有几种情况的排列组合问题。由于允许盒子内放 0 个球,因此利用添元素隔板法,即结果为
- 设采样得到的型为 ,则出现 的次数为 ;易求
- RHS:当 时,通过 2 知, 内每个序列概率均为 ;又整个型类出现概率小于 1,即 ;
LHS:当 时,直观理解出现型类 概率在所有型类中理应最大。因此
- 上述结果 2 与 3 的不等式相乘即证
下述定理给出型类陈述的(弱)大数定律。上述定理可知,型的最重要性质为:型的数量为多项式级,而序列数量为指数级,由于每个型类概率以指数依赖于真实分布与型之间的相对熵,因此对于原理真实分布的型类概率依指数衰减。
设 为 i.i.d,则
进一步可知, 依概率 1 成立
也可用于证明 AEP

易知
Sanov 定理
假设南京梅雨季节天气情况为 , ,且独立同分布,则采样一段天数 ( 天) 中雨天天数不少于 的概率?
不妨假设晴天/雨天对应 ,由中心极限定理可知
而所求概率为 ,相比期望是一个比较大的偏差,虽然可以通过 Bernoulli 分布计算出精确概率值(且 n 较大时计算量极大),但大偏差理论更关心这一概率随 n 变化的衰减速度。(更精确地,稀有事件发生概率一般写作 ,相比修正项 ,更关注主要指数项 )
- 针对偏差与概率间关系的常用公式
然而 Chebyshev 不等式只适用于单变量,CLT 以 指数衰减。实现在一个合理的相对误差边界内做估计就需要一个大的样本容量 (即 n),因此希望改善截尾概率的估计。
设 为全体概率分布的子集, 为以概率分布。定义 ,若集合 为闭包(保证 ),则

上界:由于
下界:由于 ,因此
上述为证明方便,,但实际上 n 有限时 不一定在 内,不过可以证明可找到一列分布 ,使得 且 由此易证
续上面的例子,可对应概率分布集合 ,真实分布 ,可得 。因此可估计
Draft

参考资料
© 2024 LiQ
:) 由 Obsidian&Github 强力驱动