Demo 2:重要性采样权重退化
目标:估计 \(\theta=\mathbb E_p[f(z)]\)。样本来自容易抽样的 proposal \(q(z)\),再用权重 \(w_l\propto p(z^{(l)})/q(z^{(l)})\) 修正。
曲线、贡献区域与带权样本
target \(p(z)\)
proposal \(q(z)\)
函数 \(f(z)\)
贡献 \(p(z)f(z)\)
样本颜色
红色圆点:\(f(z^{(l)})\) 较低; 绿色圆点:\(f(z^{(l)})\) 较高。它们不是接受/拒绝标记。
圆点大小
圆越大表示归一化权重 \(\bar w_l\) 越大;少数巨大的圆意味着估计被少数样本主导。
控制面板
重要性估计 \(\hat\theta_{IS}\)—
网格参考值 \(\theta_{grid}\)—
估计误差 \(|\hat\theta-\theta_{grid}|\)—
有效样本量 ESS—
最大归一化权重—
表面样本数—
数学卡片
目标量:\[\theta=\mathbb E_p[f(z)]=\int f(z)p(z)\,dz.\]
从 \(q(z)\) 抽样后:\[w_l=\frac{\tilde p(z^{(l)})}{q(z^{(l)})},\qquad \bar w_l=\frac{w_l}{\sum_j w_j}.\]
估计与诊断:\[\hat\theta_{IS}=\sum_l \bar w_l f(z^{(l)}),\qquad ESS=\frac{1}{\sum_l \bar w_l^2}.\]
如果 \(q\) 没覆盖 \(p(z)f(z)\) 的高贡献区域,\(ESS\) 会远小于 \(L\),估计误差会变大。