人工智能导论(理论)
Introduction to Artificial Intelligence (Theory)
课程基本信息
- 课程代码:PSYC2119
- 课程性质:专业必修
- 学分 / 学时:2 学分 / 36 学时(课堂教学 32 学时)
- 开课单位:心理与认知科学学院
- 适用专业:2025 心理学耀翔班
- 先修课程:概率论与随机过程
- 授课语言:中文
上课安排
- 时间:第 1–8 周,每周一 + 每周三 11–12 节
- 地点:普陀校区 · 教书院 120
- 开课时间:2026 年春季学期
课程说明
本课程以”心智即推断机器”为主线,系统梳理人工智能经典算法与人类认知过程之间的深层对应关系。以 Russell & Norvig《人工智能:一种现代方法》(第 4 版)为主干,结合认知科学、神经科学和计算精神病学的前沿文献,按搜索与推理 → 逻辑与知识 → 规划与决策 → 学习与语言 → 感知与行动五大模块展开。每章在介绍 AI 算法的数学形式之后,系统呈现其心理学起源、神经科学对应以及临床意义。
课程时间表(Course Schedule)
| 次课 | 主题 | 内容要点 | 作业节点 |
|---|---|---|---|
| 第 1 次 | 搜索与启发式推理 | 状态空间五元组;BFS / DFS / UCS;A* 算法;可采纳性与一致性;IDA*;问题空间假说;海马前向预演。 | |
| 第 2 次 | 复杂环境中的搜索 | 优化景观;爬山法;模拟退火;遗传算法;AND-OR 搜索;信念状态搜索;探索/利用与 ACC。 | |
| 第 3 次 | 约束满足问题 | CSP 三元组;弧一致性(AC-3);回溯搜索;MRV / LCV 启发式;MIN-CONFLICTS;语言句法解析作为 CSP。 | |
| 第 4 次 | 博弈与对抗搜索 | 零和博弈;Minimax 算法;α-β 剪枝;MCTS(UCB1);Theory of Mind 与多层次 Minimax;双系统理论。 | 📍 作业 1(模块一) |
| 第 5 次 | 命题逻辑智能体 | 命题逻辑语法与语义;分辨法(Resolution);DPLL;WalkSAT;KB 智能体;人类演绎推理偏差。 | |
| 第 6 次 | 一阶逻辑与推断 | FOL 语法与语义;合一算法;前向 / 后向链接;FOL 分辨法;Skolem 化;词义习得的逻辑推断。 | |
| 第 7 次 | 知识表征与本体 | 语义网络与框架;描述逻辑(TBox / ABox);OWL;非单调推理;图式理论;语义记忆层次网络。 | 📍 作业 2(模块二) |
| 第 8 次 | 自动规划 | STRIPS 形式化;前向 / 后向搜索;规划图(GraphPlan);偏序规划(POP);目标导向 vs. 习惯性行为;前额叶—纹状体与规划深度。 | |
| 第 9 次 | 简单抉择:效用与偏好 | 期望效用公理(vNM);风险态度;多属性效用(MAUT);决策树;前景理论;损失厌恶;信息价值(VoI)。 | |
| 第 10 次 | 复杂抉择:MDP 与价值迭代 | MDP 五元组;贝尔曼方程;价值迭代;策略迭代;POMDP 简介;Model-Free vs. Model-Based 神经机制;双系统切换。 | |
| 第 11 次 | 多智能体决策与博弈均衡 | 策略式博弈;纳什均衡;Shapley 值;VCG 机制;信任博弈与 Theory of Mind;Level-k 推理;社会偏好。 | 📍 作业 3(模块三) |
| 第 12 次 | 概率编程:思维程序 | 概率编程语言(Church / WebPPL);生成模型;后验推断;BPL 与 One-shot Learning;思维语言假说(LoT);主动推断简介。 | |
| 第 13 次 | 强化学习:从试错到多巴胺 | TD 学习;Q-learning;DQN;策略梯度(REINFORCE / PPO);TD 误差与多巴胺 RPE;计算精神病学含义。 | 📍 作业 4(模块四) |
| 第 14 次 | 自然语言处理与大模型 | N-gram → RNN → Transformer → LLM;Self-Attention;BERT / GPT;Surprisal 与阅读时间;LLM 与认知科学争议。 | |
| 第 15 次 | 感知与行动 | 机器人感知—规划—行动循环;SLAM;运动规划(PRM / RRT);CNN 与腹侧视觉流;预测编码;视觉工作记忆。 | 📍 作业 5(模块五) |
| 第 16 次 | 期末项目汇报 | 分组汇报:每组 12 分钟展示 + 3 分钟 Q&A。 | 📍 提交 PPT、代码包与项目报告(PDF) |
课程作业说明
本课程设 5 次模块作业,采用统一 LaTeX 模板提交,每次不超过 8 页,每模块结束后提交。
每次作业的核心结构:
- 科学问题:从本模块 AI 算法中选一种为框架,提出一个具体的心理学或认知神经科学问题——需足够聚焦,能与算法结构直接对应。
- 重要性:说明该问题的科学价值,以及它为什么需要用本章算法来分析。
- 方法:二选一——A. 行为实验设计(参与者、任务、自变量、因变量、模型预测);B. 数学推导 / 算例(公式推导、证明大纲或仿真实现思路)。
- 讨论:总结问题与方案,联系教材(AIMA)及心理学文献(至少 1—2 篇),讨论模型假设与局限。
为什么这样设计:AI 算法与人类认知之间存在深层的形式对应——搜索对应问题求解,贝尔曼方程对应多巴胺信号,Transformer 对应语言加工。作业要求学生从现象出发提问,而非复述算法,目的是培养”用算法语言分析心理现象”的跨学科建模能力,这与认知科学研究的实际工作流程一致。
评分维度:问题清晰度(15)、动机与重要性(10)、与课程内容的联系(20)、建模质量(25)、推理深度(20)、原创性(10)。
期末项目说明
主题:选择一个认知/行为科学问题,运用课程中至少一种 AI 算法框架进行建模与分析。
- 形式:分组研究(3—4 人 / 组)
- 汇报:第 16 次课,每组 12 分钟展示 + 3 分钟 Q&A
- 提交内容:汇报 PPT + 完整代码包(或数学推导文档)+ 项目报告(LaTeX,4—8 页)
评分维度:建模质量(40%)· 汇报展示(30%)· 创新点(30%)。
考核方式
| 项目 | 占比 |
|---|---|
| 课堂表现(讨论参与、作业分享、算法—认知映射展示) | 30% |
| 课后作业(5 次,每次 100 分) | 40% |
| 期末项目汇报 | 30% |
推荐教材与参考资料
主教材:Russell & Norvig,《人工智能:一种现代方法》(第 4 版),清华大学出版社。
参考书目:Goodman & Tenenbaum,Probabilistic Models of Cognition(probmods.org);Gershman,What Makes Us Smart;Parr, Pezzulo & Friston,Active Inference,MIT Press, 2022;Koller & Friedman,《概率图模型》,清华大学出版社。
精选前沿论文:Newell & Simon (1972);Schultz et al. (1997) Science;Lake et al. (2017) BBS;van Opheusden et al. (2023) Nature;Huys et al. (2012) PLOS CB;Yamins & DiCarlo (2016) Nature Neuroscience。
