Demo 7-2：Xu & Tenenbaum 强抽样概念学习

儿童看到新词标注的几个样本，推断词义范围——是窄类别还是宽类别？Strong sampling 假设样本是从概念范围内均匀抽取的：概念越小，每个样本的 likelihood 越高（"size principle"）。

假设 \(h\)：概念节点数据 \(D\)：标注样本

\[p(h \mid D) \propto p(D \mid h) \cdot p(h), \qquad p(D \mid h) = |h|^{-n} \quad \text{(strong sampling)}\]

操作

点击树中叶子节点添加样本

观察提示：在 Strong sampling 下，如果所有样本都来自同一个窄子类（如"金毛犬"），后验会强烈偏向该窄类而非宽类"狗"。切换到 Weak sampling 后，size principle 消失，宽类相对更可能。这就是为什么少量样本也能支持强泛化。

文献与案例意图
Strong sampling 是 Bayesian concept learning 的核心机制：学习者假设样本是从概念范围内"有意"抽取的。参考：Xu & Tenenbaum (2007); Tenenbaum & Griffiths (2001).