内容安排

日期 教学主题 相关资料
03/21/2026
14:00
智能计算系统全景:AI 时代为什么还要理解计算系统

从 AI 问答、拍照识题和推荐系统等日常应用出发,拆开智能应用背后的基本链条:数据如何进入系统,模型如何被调用,程序和算力如何支撑服务,为什么存储、网络、云和数据中心会影响用户体验。

书籍资料:《智能计算系统:从深度学习到大模型》第 1 章
延伸资料:
03/28/2026
14:00
数据如何进入模型:从表示到训练

先建立数据、特征、参数和模型的基本直觉,再用神经网络训练过程理解 AI 为什么需要大量数据和反复计算。本讲重点不是推导公式,而是理解数据如何被表示、如何参与训练、为什么规模会影响计算成本。

书籍资料:《智能计算系统:从深度学习到大模型》第 2 章
延伸资料:
04/11/2026
14:00
AI 应用如何落地:图像、文本、语音与大模型

通过图像分类、目标检测、文本生成、语音处理和多模态应用,理解不同 AI 应用对数据形态、模型结构、计算资源和服务链路的不同需求。课堂会把应用场景连接到后续的框架、处理器和云端系统。

书籍资料:《智能计算系统:从深度学习到大模型》第 3 章
延伸资料:
04/18/2026
14:00
框架如何组织模型:张量、计算图与 PyTorch 直觉

从“为什么不从零写训练程序”出发,认识张量、操作、计算图、模型推理和模型训练这些框架概念。课堂关注框架如何把复杂模型组织成可运行、可调试、可复用的计算过程。

书籍资料:《智能计算系统:从深度学习到大模型》第 4 章
延伸资料:
04/25/2026
14:00
框架背后的系统:自动求导、图执行与资源管理

进一步追问框架背后如何工作:计算图如何构建和执行,自动求导为什么能支持训练,设备管理、算子执行和运行时系统如何影响性能。重点是把“好用的框架”连接到底层系统设计。

书籍资料:《智能计算系统:从深度学习到大模型》第 5 章
延伸资料:
05/16/2026
14:00
处理器如何执行 AI 计算:CPU、内存、并行与深度学习处理器

从普通处理器如何执行程序讲起,再比较向量处理器和深度学习处理器为什么更适合大量相似计算。课堂用矩阵运算、内存访问和并行任务解释 AI 算力为什么不能只靠普通 CPU。

书籍资料:《智能计算系统:从深度学习到大模型》第 6 章
延伸资料:
05/23/2026
14:00
AI 芯片里的系统设计:计算、存储与通信

拆解 AI 芯片内部最关键的三件事:计算单元如何做矩阵运算,存储系统如何喂数据,通信结构如何让多个单元协作。重点理解速度瓶颈常常来自计算、存储和通信的配合。

书籍资料:《智能计算系统:从深度学习到大模型》第 7 章
延伸资料:
05/30/2026
14:00
异构系统如何协同:CPU、GPU、AI 芯片与编程语言

讨论当系统里有 CPU、GPU、AI 芯片和不同存储层次时,程序员和框架如何表达计算任务。课堂会联系异构编程、运行时、调试和性能调优,但重点放在“不同硬件如何协同完成 AI 计算”。

书籍资料:《智能计算系统:从深度学习到大模型》第 8 章
延伸资料:
06/06/2026
14:00
大模型训练系统:数据、算力、通信与集群

从大模型训练为什么昂贵切入,理解训练场景中的数据、GPU 集群、通信、系统软件、失败重跑和能耗。重点是把“大模型很大”具体化为系统资源和工程协同问题。

书籍资料:《智能计算系统:从深度学习到大模型》第 9 章
延伸资料:
06/13/2026
14:00
大模型推理与未来:延迟、成本、能耗、安全与可靠性

通过一次 AI 助手对话,拆解上下文读取、KV cache、批处理、延迟、吞吐、部署成本和用户体验之间的权衡。课堂也会讨论未来智算系统在能耗、安全、可靠性和社会影响上的长期问题。

书籍资料:《智能计算系统:从深度学习到大模型》第 9 章
延伸资料:
06/27/2026
14:00
课程大作业交流与开放讨论

结合课程大作业中的典型应用案例,回看智能计算系统的整体链条:数据、模型、框架、芯片、网络、云、成本、能耗和可靠性如何共同决定一个 AI 应用的体验。课堂可安排典型作业讨论、Panel 或开放问答。

书籍资料:《智能计算系统:从深度学习到大模型》第 1 章
延伸资料: