Demo 7:寻找心中的颜色
同一个颜色概念,依次用三种方法寻找:随机评分(稀疏命中)、MCMCP 二选一、GSP 拖动条。亲身体验后比较三种实验界面的信息效率。
选择目标概念
心里想好这个颜色词的感觉,然后依次体验三种搜索方法。
第一轮:随机评分
屏幕随机展示 8 个颜色。请逐个判断:这个颜色"像不像"你心中的 薰衣草色?
第二轮:MCMCP 二选一
每次看到两个颜色。请选择"哪一个更像"你心中的 薰衣草色。选中的颜色成为下一轮的当前颜色(Markov 链移动)。
第三轮:GSP 拖动条
每次锁定其他两个维度,只调整一个维度到你认为最像 薰衣草色 的位置。三次调整 (H→S→L) = 一轮 Gibbs 扫描。
GSP 采样轨迹
三维视图把 HSL 看成柱面:色相 H 是环绕角度,饱和度 S 是离中心半径,亮度 L 是高度。下方二维投影只是辅助查看。
三种方法效率对比
同一个颜色概念,三种方法各需多少试次?最终颜色是否接近你心中的目标?
1. 随机评分
随机撒点,大部分浪费在低概率区。每次仅回答"是/否"。
2. MCMCP 二选一
链逐步靠近目标,但每次只提供甲/乙偏好,命中稀疏、有效信息低。
3. GSP 拖动条
每次直接给出连续坐标,因此界面信息更丰富。仅 3 次即完成一轮 Gibbs 扫描。
观察提示
- 随机评分的 8 个颜色大多与目标不沾边——这就是穷举搜索的浪费。
- MCMCP 的链在 6 步内只能沿提议方向缓慢移动,最终颜色往往仍与目标有距离。
- GSP 仅 3 次调整就已经很接近目标——因为每次拖动条直接给出了一个维度的最佳位置。
- 信息量对比:随机评分常常命中稀疏、有效信息低;二选一只给出甲/乙偏好;拖动条给出连续坐标,因此不能把三者当成同一信息预算下的算法比赛。
认知科学映射
Gibbs Sampling with People (Harrison et al., 2020) 的核心洞见:采样算法不仅是解释大脑计算的理论模型,也可以成为测量主观语义空间的实验工具。你刚才亲身经历的三种方法,对应论文中从穷举评分、MCMCP 到 GSP 的效率递进。GSP 之所以高效,是因为每次拖动条操作对应 Gibbs 全条件更新 \(x_i \sim p(x_i \mid x_{-i})\),被试直接输出了一个维度的连续估计,而非仅仅做二元比较。公平地说,这比较的是实验界面的效率:课堂拖动常像给出最佳坐标;正式 GSP 更应把重复、带噪声的拖动反应看作来自条件分布的样本。
需要注意:实验结果反映的是特定被试群体、特定刺激空间中的主观联想,而非客观色彩标签。
文献与案例意图
对应章节:概念导读 例 2(用人类采样快速猜出颜色词);对应文献:Harrison2020GibbsPeople, Sanborn2010Uncovering.
完整引用:
- Harrison, P. M. C., et al. 2020. Gibbs Sampling with People. NeurIPS 33: 10659-10671.
- Sanborn, A. N., Griffiths, T. L., & Shiffrin, R. M. 2010. Uncovering mental representations with Markov chain Monte Carlo. Cognitive Psychology 60(2): 63-106.
案例想表达的想法:三种方法展示实验界面的效率递进:随机评分把大量试次浪费在低概率区域;MCMCP 的二选一任务让链向目标移动但每步只给出偏好;GSP 拖动条让被试给出连续维度坐标,对应 Gibbs 全条件采样。注意这不是同一信息预算下的公平算法竞赛。