Demo 7-2:Xu & Tenenbaum 强抽样概念学习
儿童看到新词标注的几个样本,推断词义范围——是窄类别还是宽类别?Strong sampling 假设样本是从概念范围内均匀抽取的:概念越小,每个样本的 likelihood 越高("size principle")。
假设 \(h\):概念节点
数据 \(D\):标注样本
\[p(h \mid D) \propto p(D \mid h) \cdot p(h), \qquad p(D \mid h) = |h|^{-n} \quad \text{(strong sampling)}\]
操作
点击树中叶子节点添加样本
概念层级树与后验
各假设后验概率
观察提示:在 Strong sampling 下,如果所有样本都来自同一个窄子类(如"金毛犬"),后验会强烈偏向该窄类而非宽类"狗"。切换到 Weak sampling 后,size principle 消失,宽类相对更可能。这就是为什么少量样本也能支持强泛化。
文献与案例意图
Strong sampling 是 Bayesian concept learning 的核心机制:学习者假设样本是从概念范围内"有意"抽取的。参考:Xu & Tenenbaum (2007); Tenenbaum & Griffiths (2001).
Strong sampling 是 Bayesian concept learning 的核心机制:学习者假设样本是从概念范围内"有意"抽取的。参考:Xu & Tenenbaum (2007); Tenenbaum & Griffiths (2001).