【Stats300A】L2

指数族

指数族可以描述许多常见分布(正态分布,二项分布,泊松分布等),且其与 sufficiency 以及最优 data reduction 密切相关

exponential family

The model {Pθ:θΩ} forms an s-demensional exponential family if each Pθ has density of the form:

p(x;θ)=exp(i=1sηi(θ)Ti(x)B(θ))h(x)
  • ηi(θ)R are called the natural parameters
  • Ti(x)R are its sufficient statistics
  • B(θ) is the log-partition function (logarithm of a normalization factor)
B(θ)=log(exp(i=1sηi(θ)Ti(x))h(x)dμ(x))R
  • h(x)R is base measure

h(x) 是一个与参数无关的基准测度,can be “absorbed” into the measure μ

【例】指数分布

P={Exp(θ):θ>0} 对应概率密度:

p(x;θ)=θeθxI[x0]=exp(θx+log(θ))I[x0]

一维指数族:

η(θ),T(x) 中对应的符号可以给两者任意一个。因此指数族的参数化不是唯一的

【例】Beta 分布

P={Beta(α,β):α,β>0},θ=(α,β) 对应概率密度:

p(x;θ)=xα1(1x)β1I[x(0,1)]Γ(α+β)Γ(α)Γ(β)=exp((α1)log(x)+(β1)log(1x)+log(Γ(α+β)Γ(α)Γ(β)))I[x(0,1)]

可以看出一般情况下,几个统计量 T(x) 解决几个“未知参数” η

在指数族的定义中,很自然地可以把 η(θ) 当成新的参数 η 来确定密度函数,这样密度函数的主体就是未知参数 η,T(x) 的线性组合,由此引入指数族的自然形式(也称规范形式):

【例】Gaussian 分布

概率密度:

p(xμ,σ2)=12πσexp{12σ2(xμ)2}=12πexp{μσ2x12σ2x212σ2μ2logσ}

将可以产生有效的概率密度的 η 集合定义为自然参数空间:

任意自然形式指数族可写作 P={Pη:ηH}HΘ

指数族的秩

有两种情况可以 reducing the dimension of an s-dimensional exponential family

  1. xXTi(x) 满足仿射等式约束
  1. 对所有 ηHηi 满足仿射等式约束

因此可以将指数族分为 3 类:

指数族性质

p(x1,...,xn;θ)=exp(i=1sηi(θ)j=1nTi(xj)nB(θ))j=1nh(xj)

指数相乘易证;(jT1(xj),...,jTs(xj)) 是充分统计量

G(f,η)=f(x)exp{i=1sηiTi(x)}h(x)dμ(x)

Θ 上解析(无穷次可微),且积分微分运算可调换

证明利用 Laplace 变换解析性质

参考


© 2024 LiQ :) 由 Obsidian&Github 强力驱动