Demo 2:重要性采样权重退化

目标:估计 \(\theta=\mathbb E_p[f(z)]\)。样本来自容易抽样的 proposal \(q(z)\),再用权重 \(w_l\propto p(z^{(l)})/q(z^{(l)})\) 修正。

曲线、贡献区域与带权样本

target \(p(z)\) proposal \(q(z)\) 函数 \(f(z)\) 贡献 \(p(z)f(z)\)

样本颜色

红色圆点:\(f(z^{(l)})\) 较低; 绿色圆点:\(f(z^{(l)})\) 较高。它们不是接受/拒绝标记。

圆点大小

圆越大表示归一化权重 \(\bar w_l\) 越大;少数巨大的圆意味着估计被少数样本主导。

控制面板

重要性估计 \(\hat\theta_{IS}\)
网格参考值 \(\theta_{grid}\)
估计误差 \(|\hat\theta-\theta_{grid}|\)
有效样本量 ESS
最大归一化权重
表面样本数

数学卡片

目标量:\[\theta=\mathbb E_p[f(z)]=\int f(z)p(z)\,dz.\] 从 \(q(z)\) 抽样后:\[w_l=\frac{\tilde p(z^{(l)})}{q(z^{(l)})},\qquad \bar w_l=\frac{w_l}{\sum_j w_j}.\] 估计与诊断:\[\hat\theta_{IS}=\sum_l \bar w_l f(z^{(l)}),\qquad ESS=\frac{1}{\sum_l \bar w_l^2}.\] 如果 \(q\) 没覆盖 \(p(z)f(z)\) 的高贡献区域,\(ESS\) 会远小于 \(L\),估计误差会变大。