【Stats300A】L3

Minimal Sufficiency

充分统计量做到了“用已知刻画未知”。进一步,如何使充分统计量更简单,更精细

极小充分统计量说明任何一个充分统计量 T 都可以通过函数映射得到 T(这个函数就是 ψ:T(x)T(x)),说明 T 是 minimal 的。

定理

设样本联合密度函数为 p(x;θ),如果对统计量 Tx,yX,

p(x;θ)=C(x,y)p(y;θ)T(x)=T(y)

,则 T 为极小充分统计量

如果 X 的取值集合 {xX:p(x;θ)>0} 自身与 θ 相关,那么 p(x;θ)=C(x,y)p(y;θ) 必然有 x,y 有着相同的“定义域”(must be supported by (exactly) the same θ ‘s),例如下面的均匀分布例子

Ancillary and Complete Statistics

使用充分统计量,甚至极小充分统计量表示,都不会使数据集减少的数据集?

ancillary statistic

A statistic T=T(X) is ancillary if its distribution does not depend on θ.
T is first-order ancillary if Eθ{T(X)} does not depend on θ.

某种程度上,辅助统计量包含的是“无用”信息,因为其不会带来任何关于 θ 的信息。“一阶辅助”是相对辅助较弱的概念,辅助统计量一定是一阶辅助的。

可以认为充分统计量 T “is most successful in data reduction”,如果 T 的非常数函数都不是“一阶辅助”的(Eθ{f(T)}=c,θf(T)=c,θ)。由此定义完备统计量

complete statistic

A statistic T is complete if no non-constant function of T is first-order ancillary, i.e.

Eθ{f(T)}=0,θP{f=0}=1

完备性形式化了最优数据压缩的理想概念(即统计量“不多不少”包含 θ 的全部信息),极小充分统计量是可以实现最优数据压缩的概念。下面探讨完备统计量的一些性质:

极小充分统计不一定是完备充分统计量。例如 N(μ,μ2) 中,样本均值 Xμ 的极小充分统计量(不存在能“进一步压缩”的充分统计量),但不是完备充分统计量(X 仍存在一些“冗余”)

完备性与满秩指数族(TSH 4.3.1)

(T1,,Ts) is complete for any s-dimensional full rank exponential family.

Basu's 定理

Basu’s Theorem

If T is complete and sufficient for P={Pθ:θΩ}, A is ancillary then T(X)A(X)

Basu 定理重要在于其证明了完备充分统计量与任意不含 θ 信息的统计量均无关,说明了完备充分统计量是不含 θ 的无关信息的,而充分统计量本身包含了 θ 的全部信息,因此满足完备性后该统计量在信息意义上就完美了(即达到了最优压缩的目的)

参考


© 2024 LiQ :) 由 Obsidian&Github 强力驱动