内容安排

日期	教学主题	相关资料
03/21/2026 14:00	智能计算系统全景：AI 时代为什么还要理解计算系统从 AI 问答、拍照识题和推荐系统等日常应用出发，拆开智能应用背后的基本链条：数据如何进入系统，模型如何被调用，程序和算力如何支撑服务，为什么存储、网络、云和数据中心会影响用户体验。	书籍资料：《智能计算系统：从深度学习到大模型》第 1 章延伸资料： MIT 6.033 Computer System Engineering CMU 15-213 Introduction to Computer Systems
03/28/2026 14:00	数据如何进入模型：从表示到训练先建立数据、特征、参数和模型的基本直觉，再用神经网络训练过程理解 AI 为什么需要大量数据和反复计算。本讲重点不是推导公式，而是理解数据如何被表示、如何参与训练、为什么规模会影响计算成本。	书籍资料：《智能计算系统：从深度学习到大模型》第 2 章延伸资料： CMU 15-213 Introduction to Computer Systems Stanford CS336 Language Modeling from Scratch
04/11/2026 14:00	AI 应用如何落地：图像、文本、语音与大模型通过图像分类、目标检测、文本生成、语音处理和多模态应用，理解不同 AI 应用对数据形态、模型结构、计算资源和服务链路的不同需求。课堂会把应用场景连接到后续的框架、处理器和云端系统。	书籍资料：《智能计算系统：从深度学习到大模型》第 3 章延伸资料： Stanford CS336 Language Modeling from Scratch CMU 15-642 Machine Learning Systems
04/18/2026 14:00	框架如何组织模型：张量、计算图与 PyTorch 直觉从“为什么不从零写训练程序”出发，认识张量、操作、计算图、模型推理和模型训练这些框架概念。课堂关注框架如何把复杂模型组织成可运行、可调试、可复用的计算过程。	书籍资料：《智能计算系统：从深度学习到大模型》第 4 章延伸资料： CMU 15-642 Machine Learning Systems Stanford CS149 Parallel Computing
04/25/2026 14:00	框架背后的系统：自动求导、图执行与资源管理进一步追问框架背后如何工作：计算图如何构建和执行，自动求导为什么能支持训练，设备管理、算子执行和运行时系统如何影响性能。重点是把“好用的框架”连接到底层系统设计。	书籍资料：《智能计算系统：从深度学习到大模型》第 5 章延伸资料： CMU 15-642 Machine Learning Systems Stanford CS149 Parallel Computing
05/16/2026 14:00	处理器如何执行 AI 计算：CPU、内存、并行与深度学习处理器从普通处理器如何执行程序讲起，再比较向量处理器和深度学习处理器为什么更适合大量相似计算。课堂用矩阵运算、内存访问和并行任务解释 AI 算力为什么不能只靠普通 CPU。	书籍资料：《智能计算系统：从深度学习到大模型》第 6 章延伸资料： Stanford CS149 Parallel Computing CMU 15-418/15-618 Parallel Computer Architecture and Programming
05/23/2026 14:00	AI 芯片里的系统设计：计算、存储与通信拆解 AI 芯片内部最关键的三件事：计算单元如何做矩阵运算，存储系统如何喂数据，通信结构如何让多个单元协作。重点理解速度瓶颈常常来自计算、存储和通信的配合。	书籍资料：《智能计算系统：从深度学习到大模型》第 7 章延伸资料： Stanford CS149 Parallel Computing Berkeley CS267 Applications of Parallel Computers
05/30/2026 14:00	异构系统如何协同：CPU、GPU、AI 芯片与编程语言讨论当系统里有 CPU、GPU、AI 芯片和不同存储层次时，程序员和框架如何表达计算任务。课堂会联系异构编程、运行时、调试和性能调优，但重点放在“不同硬件如何协同完成 AI 计算”。	书籍资料：《智能计算系统：从深度学习到大模型》第 8 章延伸资料： CMU 15-642 Machine Learning Systems Berkeley CS267 Applications of Parallel Computers
06/06/2026 14:00	大模型训练系统：数据、算力、通信与集群从大模型训练为什么昂贵切入，理解训练场景中的数据、GPU 集群、通信、系统软件、失败重跑和能耗。重点是把“大模型很大”具体化为系统资源和工程协同问题。	书籍资料：《智能计算系统：从深度学习到大模型》第 9 章延伸资料： CMU 11-868 Large Language Model Systems CMU 15-642 Machine Learning Systems
06/13/2026 14:00	大模型推理与未来：延迟、成本、能耗、安全与可靠性通过一次 AI 助手对话，拆解上下文读取、KV cache、批处理、延迟、吞吐、部署成本和用户体验之间的权衡。课堂也会讨论未来智算系统在能耗、安全、可靠性和社会影响上的长期问题。	书籍资料：《智能计算系统：从深度学习到大模型》第 9 章延伸资料： CMU 11-868 Large Language Model Systems Stanford CS336 Language Modeling from Scratch MIT 6.033 Computer System Engineering
06/27/2026 14:00	课程大作业交流与开放讨论结合课程大作业中的典型应用案例，回看智能计算系统的整体链条：数据、模型、框架、芯片、网络、云、成本、能耗和可靠性如何共同决定一个 AI 应用的体验。课堂可安排典型作业讨论、Panel 或开放问答。	书籍资料：《智能计算系统：从深度学习到大模型》第 1 章延伸资料： MIT 6.033 Computer System Engineering CMU 15-642 Machine Learning Systems

日期	教学主题	相关资料
03/21/2026 14:00	智能计算系统全景：AI 时代为什么还要理解计算系统从 AI 问答、拍照识题和推荐系统等日常应用出发，拆开智能应用背后的基本链条：数据如何进入系统，模型如何被调用，程序和算力如何支撑服务，为什么存储、网络、云和数据中心会影响用户体验。	书籍资料：《智能计算系统：从深度学习到大模型》第 1 章延伸资料： MIT 6.033 Computer System Engineering CMU 15-213 Introduction to Computer Systems
03/28/2026 14:00	数据如何进入模型：从表示到训练先建立数据、特征、参数和模型的基本直觉，再用神经网络训练过程理解 AI 为什么需要大量数据和反复计算。本讲重点不是推导公式，而是理解数据如何被表示、如何参与训练、为什么规模会影响计算成本。	书籍资料：《智能计算系统：从深度学习到大模型》第 2 章延伸资料： CMU 15-213 Introduction to Computer Systems Stanford CS336 Language Modeling from Scratch
04/11/2026 14:00	AI 应用如何落地：图像、文本、语音与大模型通过图像分类、目标检测、文本生成、语音处理和多模态应用，理解不同 AI 应用对数据形态、模型结构、计算资源和服务链路的不同需求。课堂会把应用场景连接到后续的框架、处理器和云端系统。	书籍资料：《智能计算系统：从深度学习到大模型》第 3 章延伸资料： Stanford CS336 Language Modeling from Scratch CMU 15-642 Machine Learning Systems
04/18/2026 14:00	框架如何组织模型：张量、计算图与 PyTorch 直觉从“为什么不从零写训练程序”出发，认识张量、操作、计算图、模型推理和模型训练这些框架概念。课堂关注框架如何把复杂模型组织成可运行、可调试、可复用的计算过程。	书籍资料：《智能计算系统：从深度学习到大模型》第 4 章延伸资料： CMU 15-642 Machine Learning Systems Stanford CS149 Parallel Computing
04/25/2026 14:00	框架背后的系统：自动求导、图执行与资源管理进一步追问框架背后如何工作：计算图如何构建和执行，自动求导为什么能支持训练，设备管理、算子执行和运行时系统如何影响性能。重点是把“好用的框架”连接到底层系统设计。	书籍资料：《智能计算系统：从深度学习到大模型》第 5 章延伸资料： CMU 15-642 Machine Learning Systems Stanford CS149 Parallel Computing
05/16/2026 14:00	处理器如何执行 AI 计算：CPU、内存、并行与深度学习处理器从普通处理器如何执行程序讲起，再比较向量处理器和深度学习处理器为什么更适合大量相似计算。课堂用矩阵运算、内存访问和并行任务解释 AI 算力为什么不能只靠普通 CPU。	书籍资料：《智能计算系统：从深度学习到大模型》第 6 章延伸资料： Stanford CS149 Parallel Computing CMU 15-418/15-618 Parallel Computer Architecture and Programming
05/23/2026 14:00	AI 芯片里的系统设计：计算、存储与通信拆解 AI 芯片内部最关键的三件事：计算单元如何做矩阵运算，存储系统如何喂数据，通信结构如何让多个单元协作。重点理解速度瓶颈常常来自计算、存储和通信的配合。	书籍资料：《智能计算系统：从深度学习到大模型》第 7 章延伸资料： Stanford CS149 Parallel Computing Berkeley CS267 Applications of Parallel Computers
05/30/2026 14:00	异构系统如何协同：CPU、GPU、AI 芯片与编程语言讨论当系统里有 CPU、GPU、AI 芯片和不同存储层次时，程序员和框架如何表达计算任务。课堂会联系异构编程、运行时、调试和性能调优，但重点放在“不同硬件如何协同完成 AI 计算”。	书籍资料：《智能计算系统：从深度学习到大模型》第 8 章延伸资料： CMU 15-642 Machine Learning Systems Berkeley CS267 Applications of Parallel Computers
06/06/2026 14:00	大模型训练系统：数据、算力、通信与集群从大模型训练为什么昂贵切入，理解训练场景中的数据、GPU 集群、通信、系统软件、失败重跑和能耗。重点是把“大模型很大”具体化为系统资源和工程协同问题。	书籍资料：《智能计算系统：从深度学习到大模型》第 9 章延伸资料： CMU 11-868 Large Language Model Systems CMU 15-642 Machine Learning Systems
06/13/2026 14:00	大模型推理与未来：延迟、成本、能耗、安全与可靠性通过一次 AI 助手对话，拆解上下文读取、KV cache、批处理、延迟、吞吐、部署成本和用户体验之间的权衡。课堂也会讨论未来智算系统在能耗、安全、可靠性和社会影响上的长期问题。	书籍资料：《智能计算系统：从深度学习到大模型》第 9 章延伸资料： CMU 11-868 Large Language Model Systems Stanford CS336 Language Modeling from Scratch MIT 6.033 Computer System Engineering
06/27/2026 14:00	课程大作业交流与开放讨论结合课程大作业中的典型应用案例，回看智能计算系统的整体链条：数据、模型、框架、芯片、网络、云、成本、能耗和可靠性如何共同决定一个 AI 应用的体验。课堂可安排典型作业讨论、Panel 或开放问答。	书籍资料：《智能计算系统：从深度学习到大模型》第 1 章延伸资料： MIT 6.033 Computer System Engineering CMU 15-642 Machine Learning Systems