Demo 7：寻找心中的颜色

同一个颜色概念，依次用三种方法寻找：随机评分（稀疏命中）、MCMCP 二选一、GSP 拖动条。亲身体验后比较三种实验界面的信息效率。

选择目标概念

心里想好这个颜色词的感觉，然后依次体验三种搜索方法。

第一轮：随机评分

屏幕随机展示 8 个颜色。请逐个判断：这个颜色"像不像"你心中的 薰衣草色？

颜色 1 / 8 HSL:

第二轮：MCMCP 二选一

每次看到两个颜色。请选择"哪一个更像"你心中的 薰衣草色。选中的颜色成为下一轮的当前颜色（Markov 链移动）。

第 1 / 6 次比较

第三轮：GSP 拖动条

每次锁定其他两个维度，只调整一个维度到你认为最像 薰衣草色 的位置。三次调整 (H→S→L) = 一轮 Gibbs 扫描。

第 1 轮 Gibbs 扫描 | 调整 1/3

H 色相可调180

0 红60 黄120 绿180 青240 蓝300 紫360

S 饱和度锁定50

0% 灰50%100% 纯色

L 亮度锁定50

0% 黑50%100% 白

GSP 采样轨迹

更新 H 色相更新 S 饱和度更新 L 亮度黑边大圆 = 当前点

三维视图把 HSL 看成柱面：色相 H 是环绕角度，饱和度 S 是离中心半径，亮度 L 是高度。下方二维投影只是辅助查看。

完成轮数

总调整次数

当前维度

三种方法效率对比

同一个颜色概念，三种方法各需多少试次？最终颜色是否接近你心中的目标？

1. 随机评分

无匹配

试次：8

命中：0/8

随机撒点，大部分浪费在低概率区。每次仅回答"是/否"。

2. MCMCP 二选一

试次：6

链逐步靠近目标，但每次只提供甲/乙偏好，命中稀疏、有效信息低。

3. GSP 拖动条

试次：3

每次直接给出连续坐标，因此界面信息更丰富。仅 3 次即完成一轮 Gibbs 扫描。

观察提示

随机评分的 8 个颜色大多与目标不沾边——这就是穷举搜索的浪费。
MCMCP 的链在 6 步内只能沿提议方向缓慢移动，最终颜色往往仍与目标有距离。
GSP 仅 3 次调整就已经很接近目标——因为每次拖动条直接给出了一个维度的最佳位置。
信息量对比：随机评分常常命中稀疏、有效信息低；二选一只给出甲/乙偏好；拖动条给出连续坐标，因此不能把三者当成同一信息预算下的算法比赛。

认知科学映射

Gibbs Sampling with People (Harrison et al., 2020) 的核心洞见：采样算法不仅是解释大脑计算的理论模型，也可以成为测量主观语义空间的实验工具。你刚才亲身经历的三种方法，对应论文中从穷举评分、MCMCP 到 GSP 的效率递进。GSP 之所以高效，是因为每次拖动条操作对应 Gibbs 全条件更新 \(x_i \sim p(x_i \mid x_{-i})\)，被试直接输出了一个维度的连续估计，而非仅仅做二元比较。公平地说，这比较的是实验界面的效率：课堂拖动常像给出最佳坐标；正式 GSP 更应把重复、带噪声的拖动反应看作来自条件分布的样本。

需要注意：实验结果反映的是特定被试群体、特定刺激空间中的主观联想，而非客观色彩标签。

文献与案例意图

对应章节：概念导读例 2（用人类采样快速猜出颜色词）；对应文献：Harrison2020GibbsPeople, Sanborn2010Uncovering.

完整引用：

Harrison, P. M. C., et al. 2020. Gibbs Sampling with People. NeurIPS 33: 10659-10671.
Sanborn, A. N., Griffiths, T. L., & Shiffrin, R. M. 2010. Uncovering mental representations with Markov chain Monte Carlo. Cognitive Psychology 60(2): 63-106.

案例想表达的想法：三种方法展示实验界面的效率递进：随机评分把大量试次浪费在低概率区域；MCMCP 的二选一任务让链向目标移动但每步只给出偏好；GSP 拖动条让被试给出连续维度坐标，对应 Gibbs 全条件采样。注意这不是同一信息预算下的公平算法竞赛。