Chapter 10 · Demo 1 · HMM 与离散时序模型

Saffran 统计词切分

婴儿听到连续音节流,没有停顿,但转移概率暗示词边界。词内转移概率高,词间转移概率低。
核心公式:\(p(x_t|x_{t-1})\),边界处转移概率突降

音节时间线与转移概率

观察提示

文献与案例意图

参考 Saffran, Aslin & Newport (1996) 婴儿统计学习、Goldwater et al. (2009) Bayesian word segmentation。案例说明 HMM/Markov 模型能解释人类如何从连续语言输入中发现离散词单元。

  • BRML Ch24 Discrete-State Markov Models
  • Bishop PRML Ch13 Sequential Data