Demo 6-3：Efficient Coding 中的 KL 散度

视觉系统需要用有限资源编码自然刺激。如果编码模型分布 \(q(x)\) 与自然刺激统计 \(p(x)\) 不匹配，会产生额外的编码成本（多余比特），用 KL 散度度量。

自然刺激分布 \(p(x)\) 编码模型分布 \(q(x)\) KL 不匹配区域

\[KL(p \| q) = \sum_x p(x) \log \frac{p(x)}{q(x)} \geq 0\]

参数控制

模型均值 \(\mu_q\): 0.0

模型标准差 \(\sigma_q\): 1.0

自然分布偏度: 0.0

0.000

KL(p‖q) bits

—

H(p) 熵

—

H(p,q) 交叉熵

观察提示：当模型分布 \(q\) 与自然分布 \(p\) 完全重合时，KL = 0——没有浪费。偏移 \(\mu_q\) 或改变 \(\sigma_q\) 会增大 KL。注意 KL 不对称：\(p\) 有密度但 \(q\) 很低的地方贡献特别大。

文献与案例意图
Efficient coding 假说认为感觉系统的编码方式匹配环境统计。KL 散度可以解释为使用错误编码模型时浪费的 bits。参考：Attneave (1954); Barlow (1961); Simoncelli & Olshausen (2001).