每个阶段、每节课的状态追踪表。本文件里的状态符号会喂给网站(site/build.js 会把它们解析进 site/data.js),别改它们的形状。
总预计时长:约 314 小时,按自己的节奏来。
图例: ✅ 已完成 · 🚧 进行中 · ⬚ 计划中
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 开发环境 | ✅ | ~75 min |
| 02 | Git 与协作 | ✅ | ~45 min |
| 03 | GPU 配置与云端 | ✅ | ~75 min |
| 04 | API 与密钥 | ✅ | ~75 min |
| 05 | Jupyter Notebook | ✅ | ~75 min |
| 06 | Python 环境 | ✅ | ~75 min |
| 07 | 面向 AI 的 Docker | ✅ | ~75 min |
| 08 | 编辑器配置 | ✅ | ~75 min |
| 09 | 数据管理 | ✅ | ~75 min |
| 10 | 终端与 Shell | ✅ | ~45 min |
| 11 | 面向 AI 的 Linux | ✅ | ~45 min |
| 12 | 调试与性能分析 | ✅ | ~75 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 线性代数直觉 | ✅ | ~45 min |
| 02 | 向量、矩阵与运算 | ✅ | ~75 min |
| 03 | 矩阵变换与特征值 | ✅ | ~75 min |
| 04 | 面向 ML 的微积分 — 导数与梯度 | ✅ | ~45 min |
| 05 | 链式法则与自动微分 | ✅ | ~75 min |
| 06 | 概率与分布 | ✅ | ~45 min |
| 07 | 贝叶斯定理与统计思维 | ✅ | ~75 min |
| 08 | 优化 — 梯度下降家族 | ✅ | ~75 min |
| 09 | 信息论 — 熵、KL 散度 | ✅ | ~45 min |
| 10 | 降维 — PCA、t-SNE、UMAP | ✅ | ~75 min |
| 11 | 奇异值分解 | ✅ | ~75 min |
| 12 | 张量运算 | ✅ | ~75 min |
| 13 | 数值稳定性 | ✅ | ~45 min |
| 14 | 范数与距离 | ✅ | ~45 min |
| 15 | 面向 ML 的统计学 | ✅ | ~45 min |
| 16 | 采样方法 | ✅ | ~75 min |
| 17 | 线性方程组 | ✅ | ~75 min |
| 18 | 凸优化 | ✅ | ~75 min |
| 19 | 面向 AI 的复数 | ✅ | ~45 min |
| 20 | 傅里叶变换 | ✅ | ~75 min |
| 21 | 面向 ML 的图论 | ✅ | ~45 min |
| 22 | 随机过程 | ✅ | ~45 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 什么是机器学习 — 类型与分类 | ✅ | ~45 min |
| 02 | 从零实现线性回归 | ✅ | ~75 min |
| 03 | 逻辑回归与分类 | ✅ | ~75 min |
| 04 | 决策树与随机森林 | ✅ | ~75 min |
| 05 | 支持向量机 | ✅ | ~75 min |
| 06 | K 近邻与距离度量 | ✅ | ~75 min |
| 07 | 无监督学习 — K-Means、DBSCAN | ✅ | ~75 min |
| 08 | 特征工程与特征选择 | ✅ | ~75 min |
| 09 | 模型评估 — 指标、交叉验证 | ✅ | ~75 min |
| 10 | 偏差、方差与学习曲线 | ✅ | ~45 min |
| 11 | 集成方法 — Boosting、Bagging、Stacking | ✅ | ~75 min |
| 12 | 超参数调优与 AutoML | ✅ | ~75 min |
| 13 | ML 流水线与实验追踪 | ✅ | ~75 min |
| 14 | 朴素贝叶斯 — 多项式、高斯、伯努利 | ✅ | ~75 min |
| 15 | 时间序列基础 | ✅ | ~45 min |
| 16 | 异常检测 | ✅ | ~75 min |
| 17 | 处理不平衡数据 | ✅ | ~75 min |
| 18 | 特征选择 | ✅ | ~75 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 感知机 — 一切的起点 | ✅ | ~45 min |
| 02 | 多层网络与前向传播 | ✅ | ~75 min |
| 03 | 从零实现反向传播 | ✅ | ~75 min |
| 04 | 激活函数 — ReLU、Sigmoid、GELU 及其原理 | ✅ | ~45 min |
| 05 | 损失函数 — MSE、交叉熵、对比损失 | ✅ | ~45 min |
| 06 | 优化器 — SGD、Momentum、Adam、AdamW | ✅ | ~75 min |
| 07 | 正则化 — Dropout、权重衰减、BatchNorm | ✅ | ~75 min |
| 08 | 权重初始化与训练稳定性 | ✅ | ~45 min |
| 09 | 学习率调度与预热 | ✅ | ~45 min |
| 10 | 打造你自己的迷你框架 | ✅ | ~120 min |
| 11 | PyTorch 入门 | ✅ | ~75 min |
| 12 | JAX 入门 | ✅ | ~75 min |
| 13 | 调试神经网络 | ✅ | ~75 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 图像基础 — 像素、通道、色彩空间 | ✅ | ~45 min |
| 02 | 从零实现卷积 | ✅ | ~75 min |
| 03 | CNN — 从 LeNet 到 ResNet | ✅ | ~75 min |
| 04 | 图像分类 | ✅ | ~75 min |
| 05 | 迁移学习与微调 | ✅ | ~75 min |
| 06 | 目标检测 — 从零实现 YOLO | ✅ | ~75 min |
| 07 | 语义分割 — U-Net | ✅ | ~75 min |
| 08 | 实例分割 — Mask R-CNN | ✅ | ~75 min |
| 09 | 图像生成 — GAN | ✅ | ~75 min |
| 10 | 图像生成 — 扩散模型 | ✅ | ~75 min |
| 11 | Stable Diffusion — 架构与微调 | ✅ | ~75 min |
| 12 | 视频理解 — 时序建模 | ✅ | ~45 min |
| 13 | 3D 视觉 — 点云、NeRF | ✅ | ~45 min |
| 14 | Vision Transformer (ViT) | ✅ | ~45 min |
| 15 | 实时视觉 — 边缘部署 | ✅ | ~75 min |
| 16 | 构建完整的视觉流水线 | ✅ | ~120 min |
| 17 | 自监督视觉 — SimCLR、DINO、MAE | ✅ | ~75 min |
| 18 | 开放词表视觉 — CLIP | ✅ | ~45 min |
| 19 | OCR 与文档理解 | ✅ | ~45 min |
| 20 | 图像检索与度量学习 | ✅ | ~45 min |
| 21 | 关键点检测与姿态估计 | ✅ | ~45 min |
| 22 | 从零实现 3D 高斯泼溅 | ✅ | ~90 min |
| 23 | 扩散 Transformer 与整流流 | ✅ | ~75 min |
| 24 | SAM 3 与开放词表分割 | ✅ | ~60 min |
| 25 | 视觉语言模型 (ViT-MLP-LLM) | ✅ | ~75 min |
| 26 | 单目深度与几何估计 | ✅ | ~60 min |
| 27 | 多目标跟踪与视频记忆 | ✅ | ~60 min |
| 28 | 世界模型与视频扩散 | ✅ | ~75 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 文本处理 — 分词、词干提取、词形还原 | ✅ | ~45 min |
| 02 | 词袋、TF-IDF 与文本表示 | ✅ | ~75 min |
| 03 | 词嵌入 — 从零实现 Word2Vec | ✅ | ~75 min |
| 04 | GloVe、FastText 与子词嵌入 | ✅ | ~45 min |
| 05 | 情感分析 | ✅ | ~75 min |
| 06 | 命名实体识别 (NER) | ✅ | ~75 min |
| 07 | 词性标注与句法分析 | ✅ | ~45 min |
| 08 | 文本分类 — 用于文本的 CNN 与 RNN | ✅ | ~75 min |
| 09 | 序列到序列模型 | ✅ | ~75 min |
| 10 | 注意力机制 — 突破性进展 | ✅ | ~45 min |
| 11 | 机器翻译 | ✅ | ~75 min |
| 12 | 文本摘要 | ✅ | ~75 min |
| 13 | 问答系统 | ✅ | ~75 min |
| 14 | 信息检索与搜索 | ✅ | ~75 min |
| 15 | 主题建模 — LDA、BERTopic | ✅ | ~45 min |
| 16 | 文本生成 — Transformer 之前的语言模型 | ✅ | ~45 min |
| 17 | 聊天机器人 — 从规则驱动到神经网络 | ✅ | ~75 min |
| 18 | 多语言 NLP | ✅ | ~45 min |
| 19 | 子词分词 — BPE、WordPiece、Unigram、SentencePiece | ✅ | ~60 min |
| 20 | 结构化输出与约束解码 | ✅ | ~60 min |
| 21 | 自然语言推理与文本蕴含 | ✅ | ~60 min |
| 22 | 嵌入模型深入剖析 | ✅ | ~60 min |
| 23 | 面向 RAG 的分块策略 | ✅ | ~60 min |
| 24 | 共指消解 | ✅ | ~60 min |
| 25 | 实体链接与消歧 | ✅ | ~60 min |
| 26 | 关系抽取与知识图谱构建 | ✅ | ~60 min |
| 27 | LLM 评估 — RAGAS、DeepEval、G-Eval | ✅ | ~75 min |
| 28 | 长上下文评估 — NIAH、RULER、LongBench、MRCR | ✅ | ~60 min |
| 29 | 对话状态追踪 | ✅ | ~75 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 音频基础 — 波形、采样、傅里叶变换 | ✅ | ~45 min |
| 02 | 频谱图、梅尔标度与音频特征 | ✅ | ~45 min |
| 03 | 音频分类 | ✅ | ~75 min |
| 04 | 语音识别 (ASR) | ✅ | ~45 min |
| 05 | Whisper — 架构与微调 | ✅ | ~75 min |
| 06 | 说话人识别与验证 | ✅ | ~45 min |
| 07 | 文本转语音 (TTS) | ✅ | ~75 min |
| 08 | 声音克隆与音色转换 | ✅ | ~75 min |
| 09 | 音乐生成 | ✅ | ~75 min |
| 10 | 音频语言模型 | ✅ | ~45 min |
| 11 | 实时音频处理 | ✅ | ~75 min |
| 12 | 构建语音助手流水线 | ✅ | ~120 min |
| 13 | 神经音频编解码器 — EnCodec、SNAC、Mimi、DAC | ✅ | ~60 min |
| 14 | 语音活动检测与轮次切换 | ✅ | ~45 min |
| 15 | 流式语音到语音 — Moshi、Hibiki | ✅ | ~75 min |
| 16 | 语音防伪与音频水印 | ✅ | ~75 min |
| 17 | 音频评估 — WER、MOS、MMAU、排行榜 | ✅ | ~60 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 为什么需要 Transformer — RNN 的问题所在 | ✅ | ~45 min |
| 02 | 从零实现自注意力 | ✅ | ~75 min |
| 03 | 多头注意力 | ✅ | ~75 min |
| 04 | 位置编码 — 正弦、RoPE、ALiBi | ✅ | ~45 min |
| 05 | 完整的 Transformer — 编码器 + 解码器 | ✅ | ~75 min |
| 06 | BERT — 掩码语言建模 | ✅ | ~45 min |
| 07 | GPT — 因果语言建模 | ✅ | ~75 min |
| 08 | T5、BART — 编码器-解码器模型 | ✅ | ~45 min |
| 09 | Vision Transformer (ViT) | ✅ | ~45 min |
| 10 | 音频 Transformer — Whisper 架构 | ✅ | ~45 min |
| 11 | 混合专家 (MoE) | ✅ | ~45 min |
| 12 | KV 缓存、Flash Attention 与推理优化 | ✅ | ~75 min |
| 13 | 缩放定律 | ✅ | ~45 min |
| 14 | 从零实现一个 Transformer — 总结项目 | ✅ | ~120 min |
| 15 | Attention 变体——滑动窗口、稀疏、差分 | ✅ | ~90 min |
| 16 | 投机解码——草稿、验证、重复 | ✅ | ~90 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 生成模型 — 分类与历史 | ✅ | ~45 min |
| 02 | 自编码器与 VAE | ✅ | ~75 min |
| 03 | GAN — 生成器对判别器 | ✅ | ~75 min |
| 04 | 条件 GAN 与 Pix2Pix | ✅ | ~75 min |
| 05 | StyleGAN | ✅ | ~45 min |
| 06 | 扩散模型 — 从零实现 DDPM | ✅ | ~75 min |
| 07 | 潜在扩散与 Stable Diffusion | ✅ | ~75 min |
| 08 | ControlNet、LoRA 与图像条件控制 | ✅ | ~75 min |
| 09 | 图像修复、扩展与编辑 | ✅ | ~75 min |
| 10 | 视频生成 | ✅ | ~45 min |
| 11 | 音频生成 | ✅ | ~45 min |
| 12 | 3D 生成 | ✅ | ~45 min |
| 13 | 流匹配与整流流 | ✅ | ~45 min |
| 14 | 评估 — FID、CLIP Score、人类偏好 | ✅ | ~45 min |
| 19 | 视觉自回归建模(VAR):下一尺度预测 | ✅ | ~90 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | MDP、状态、动作与奖励 | ✅ | ~45 min |
| 02 | 动态规划 | ✅ | ~75 min |
| 03 | 蒙特卡洛方法 | ✅ | ~75 min |
| 04 | 时序差分 — Q-Learning、SARSA | ✅ | ~75 min |
| 05 | 深度 Q 网络 (DQN) | ✅ | ~75 min |
| 06 | 策略梯度方法 — REINFORCE | ✅ | ~75 min |
| 07 | Actor-Critic — A2C、A3C | ✅ | ~75 min |
| 08 | 近端策略优化 (PPO) | ✅ | ~75 min |
| 09 | 奖励建模与 RLHF | ✅ | ~45 min |
| 10 | 多智能体强化学习 | ✅ | ~45 min |
| 11 | 从仿真到现实的迁移 | ✅ | ~45 min |
| 12 | 游戏中的强化学习 | ✅ | ~75 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 分词器 — BPE、WordPiece、SentencePiece | ✅ | ~45 min |
| 02 | 从零实现一个分词器 | ✅ | ~75 min |
| 03 | 预训练数据流水线 | ✅ | ~75 min |
| 04 | 预训练一个迷你 GPT (124M) | ✅ | ~120 min |
| 05 | 扩展 — 分布式训练、FSDP、DeepSpeed | ✅ | ~75 min |
| 06 | 指令微调 — SFT | ✅ | ~75 min |
| 07 | RLHF — 奖励模型 + PPO 训练 | ✅ | ~75 min |
| 08 | DPO — 直接偏好优化 | ✅ | ~75 min |
| 09 | Constitutional AI 与自我改进 | ✅ | ~45 min |
| 10 | 评估 — 基准、Eval、LM Harness | ✅ | ~75 min |
| 11 | 量化 — INT8、GPTQ、AWQ、GGUF | ✅ | ~75 min |
| 12 | 推理优化 | ✅ | ~75 min |
| 13 | 构建完整的 LLM 流水线 | ✅ | ~120 min |
| 14 | 开源模型 — 架构逐步剖析 | ✅ | ~45 min |
| 15 | 推测解码与 EAGLE-3 | ✅ | ~75 min |
| 16 | 差分注意力 (V2) | ✅ | ~60 min |
| 17 | 原生稀疏注意力 (DeepSeek NSA) | ✅ | ~60 min |
| 18 | 多 token 预测 (MTP) | ✅ | ~60 min |
| 19 | DualPipe 并行 | ✅ | ~60 min |
| 20 | DeepSeek-V3 架构逐步剖析 | ✅ | ~75 min |
| 21 | Jamba — 混合 SSM-Transformer | ✅ | ~60 min |
| 22 | 异步与 Hogwild! 推理 | ✅ | ~60 min |
| 25 | 推测解码与 EAGLE | ✅ | ~90 min |
| 34 | 梯度检查点与激活重算 | ✅ | ~90 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 提示工程 — 技巧与模式 | ✅ | ~45 min |
| 02 | 少样本、思维链、思维树 | ✅ | ~45 min |
| 03 | 结构化输出 | ✅ | ~75 min |
| 04 | 嵌入与向量表示 | ✅ | ~75 min |
| 05 | 上下文工程 | ✅ | ~75 min |
| 06 | RAG — 检索增强生成 | ✅ | ~75 min |
| 07 | 进阶 RAG | ✅ | ~75 min |
| 08 | 用 LoRA 与 QLoRA 微调 | ✅ | ~75 min |
| 09 | 函数调用与工具使用 | ✅ | ~75 min |
| 10 | 评估与测试 LLM 应用 | ✅ | ~45 min |
| 11 | 缓存、限流与成本优化 | ✅ | ~45 min |
| 12 | 护栏、安全与内容过滤 | ✅ | ~45 min |
| 13 | 构建生产级 LLM 应用 | ✅ | ~120 min |
| 14 | 模型上下文协议 (MCP) | ✅ | ~75 min |
| 15 | 提示缓存与上下文缓存 | ✅ | ~60 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | Vision Transformer 与图块-token 原语 | ✅ | ~120 min |
| 02 | CLIP 与对比式视觉语言预训练 | ✅ | ~180 min |
| 03 | BLIP-2 与作为模态桥梁的 Q-Former | ✅ | ~180 min |
| 04 | Flamingo 与门控交叉注意力 | ✅ | ~120 min |
| 05 | LLaVA 与视觉指令微调 | ✅ | ~180 min |
| 06 | 任意分辨率视觉:Patch-n'-Pack 与 NaFlex | ✅ | ~120 min |
| 07 | 开源权重 VLM 配方:真正重要的是什么 | ✅ | ~180 min |
| 08 | LLaVA-OneVision:单图、多图、视频 | ✅ | ~180 min |
| 09 | Qwen-VL 家族与动态帧率视频 | ✅ | ~120 min |
| 10 | InternVL3 原生多模态预训练 | ✅ | ~120 min |
| 11 | Chameleon 与早融合纯 token | ✅ | ~180 min |
| 12 | Emu3 用下一 token 预测做生成 | ✅ | ~120 min |
| 13 | Transfusion 自回归 + 扩散 | ✅ | ~180 min |
| 14 | Show-o 与离散扩散统一 | ✅ | ~120 min |
| 15 | Janus-Pro 解耦编码器 | ✅ | ~120 min |
| 16 | MIO 任意到任意流式处理 | ✅ | ~120 min |
| 17 | 视频语言时序定位 | ✅ | ~180 min |
| 18 | 百万 token 上下文下的长视频理解 | ✅ | ~180 min |
| 19 | 音频语言模型:从 Whisper 到 AF3 | ✅ | ~180 min |
| 20 | 全模态模型:Thinker-Talker | ✅ | ~180 min |
| 21 | 具身 VLA:RT-2、OpenVLA、π0、GR00T | ✅ | ~180 min |
| 22 | 文档与图表理解 | ✅ | ~180 min |
| 23 | ColPali 视觉原生文档 RAG | ✅ | ~180 min |
| 24 | 多模态 RAG 与跨模态检索 | ✅ | ~180 min |
| 25 | 多模态智能体与计算机操作 (总结项目) | ✅ | ~240 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 工具接口 | ✅ | ~45 min |
| 02 | 函数调用深入剖析 | ✅ | ~75 min |
| 03 | 并行与流式工具调用 | ✅ | ~75 min |
| 04 | 结构化输出 | ✅ | ~75 min |
| 05 | 工具 Schema 设计 | ✅ | ~45 min |
| 06 | MCP 基础 | ✅ | ~45 min |
| 07 | 构建一个 MCP Server | ✅ | ~75 min |
| 08 | 构建一个 MCP Client | ✅ | ~75 min |
| 09 | MCP 传输层 | ✅ | ~45 min |
| 10 | MCP 资源与 Prompt | ✅ | ~45 min |
| 11 | MCP Sampling | ✅ | ~75 min |
| 12 | MCP Roots 与 Elicitation | ✅ | ~45 min |
| 13 | MCP 异步任务 | ✅ | ~75 min |
| 14 | MCP Apps | ✅ | ~75 min |
| 15 | MCP 安全 I — 工具投毒 | ✅ | ~45 min |
| 16 | MCP 安全 II — OAuth 2.1 | ✅ | ~75 min |
| 17 | MCP 网关与注册中心 | ✅ | ~45 min |
| 18 | 生产环境中的 MCP 认证 — iii 上的 DCR + JWKS | ✅ | ~90 min |
| 19 | A2A 协议 | ✅ | ~75 min |
| 20 | OpenTelemetry GenAI | ✅ | ~75 min |
| 21 | LLM 路由层 | ✅ | ~45 min |
| 22 | Skill 与 Agent SDK | ✅ | ~45 min |
| 23 | 总结项目 — 工具生态系统 | ✅ | ~120 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 智能体循环 | ✅ | ~60 min |
| 02 | ReWOO 与规划-执行 | ✅ | ~60 min |
| 03 | Reflexion 与言语强化学习 | ✅ | ~60 min |
| 04 | 思维树与 LATS | ✅ | ~75 min |
| 05 | Self-Refine 与 CRITIC | ✅ | ~60 min |
| 06 | 工具使用与函数调用 | ✅ | ~60 min |
| 07 | 记忆 — 虚拟上下文与 MemGPT | ✅ | ~75 min |
| 08 | 记忆块与睡眠时计算 (Letta) | ✅ | ~75 min |
| 09 | 混合记忆 — 向量 + 图 + KV (Mem0) | ✅ | ~75 min |
| 10 | 技能库与终身学习 (Voyager) | ✅ | ~75 min |
| 11 | 用 HTN 与进化搜索做规划 | ✅ | ~75 min |
| 12 | Anthropic 的工作流模式 | ✅ | ~60 min |
| 13 | LangGraph — 有状态图与持久化执行 | ✅ | ~75 min |
| 14 | AutoGen v0.4 — Actor 模型 | ✅ | ~75 min |
| 15 | CrewAI — 基于角色的团队与流程 | ✅ | ~60 min |
| 16 | OpenAI Agents SDK — 移交、护栏、追踪 | ✅ | ~75 min |
| 17 | Claude Agent SDK — 子智能体与会话存储 | ✅ | ~75 min |
| 18 | Agno 与 Mastra — 生产级运行时 | ✅ | ~45 min |
| 19 | 基准 — SWE-bench、GAIA、AgentBench | ✅ | ~60 min |
| 20 | 基准 — WebArena 与 OSWorld | ✅ | ~60 min |
| 21 | 计算机操作 — Claude、OpenAI CUA、Gemini | ✅ | ~60 min |
| 22 | 语音智能体 — Pipecat 与 LiveKit | ✅ | ~60 min |
| 23 | OpenTelemetry GenAI 语义约定 | ✅ | ~60 min |
| 24 | 智能体可观测性 — Langfuse、Phoenix、Opik | ✅ | ~45 min |
| 25 | 多智能体辩论与协作 | ✅ | ~60 min |
| 26 | 故障模式 — 智能体为何崩溃 | ✅ | ~60 min |
| 27 | 提示注入与 PVE 防御 | ✅ | ~75 min |
| 28 | 编排模式 — 主管、蜂群、分层 | ✅ | ~60 min |
| 29 | 生产级运行时 — 队列、事件、定时任务 | ✅ | ~60 min |
| 30 | 评估驱动的智能体开发 | ✅ | ~60 min |
| 31 | 智能体工作台:能力强的模型为何仍会失败 | ✅ | ~45 min |
| 32 | 最小智能体工作台 | ✅ | ~45 min |
| 33 | 把智能体指令写成可执行的约束 | ✅ | ~50 min |
| 34 | 仓库记忆与持久化状态 | ✅ | ~60 min |
| 35 | 智能体的初始化脚本 | ✅ | ~45 min |
| 36 | 范围契约与任务边界 | ✅ | ~50 min |
| 37 | 运行时反馈循环 | ✅ | ~50 min |
| 38 | 验证关卡 | ✅ | ~55 min |
| 39 | 审查智能体:把构建者和评分者分开 | ✅ | ~55 min |
| 40 | 多会话交接 | ✅ | ~50 min |
| 41 | 在真实仓库上跑工作台 | ✅ | ~60 min |
| 42 | 总结项目:交付一个可复用的智能体工作台包 | ✅ | ~75 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 从聊天机器人到长时程智能体 (METR) | ✅ | ~45 min |
| 02 | STaR、V-STaR、Quiet-STaR — 自学推理 | ✅ | ~60 min |
| 03 | AlphaEvolve — 进化式编码智能体 | ✅ | ~60 min |
| 04 | Darwin Gödel Machine — 自我修改智能体 | ✅ | ~60 min |
| 05 | AI Scientist v2 — 研讨会级研究 | ✅ | ~60 min |
| 06 | 自动化对齐研究 (Anthropic AAR) | ✅ | ~60 min |
| 07 | 递归自我改进 — 能力对齐之争 | ✅ | ~60 min |
| 08 | 有界自我改进设计 | ✅ | ~60 min |
| 09 | 自主编码智能体全景 (SWE-bench、CodeAct) | ✅ | ~45 min |
| 10 | Claude Code 权限模式与自动模式 | ✅ | ~45 min |
| 11 | 浏览器智能体与间接提示注入 | ✅ | ~45 min |
| 12 | 长时运行智能体的持久化执行 | ✅ | ~60 min |
| 13 | 动作预算、迭代上限、成本调控器 | ✅ | ~60 min |
| 14 | 急停开关、熔断器、金丝雀 token | ✅ | ~60 min |
| 15 | HITL — 先提议后提交 | ✅ | ~60 min |
| 16 | 检查点与回滚 | ✅ | ~60 min |
| 17 | Constitutional AI 与规则覆盖 | ✅ | ~60 min |
| 18 | Llama Guard 与输入/输出分类 | ✅ | ~45 min |
| 19 | Anthropic 负责任扩展政策 v3.0 | ✅ | ~45 min |
| 20 | OpenAI 准备框架与 DeepMind FSF | ✅ | ~45 min |
| 21 | METR 时间跨度与外部评估 | ✅ | ~60 min |
| 22 | CAIS、CAISI 与社会尺度风险 | ✅ | ~45 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 为什么需要多智能体 | ✅ | ~45 min |
| 02 | FIPA-ACL 传承与言语行为 | ✅ | ~60 min |
| 03 | 通信协议 | ✅ | ~45 min |
| 04 | 多智能体原语模型 | ✅ | ~60 min |
| 05 | 主管 / 编排器-工作者模式 | ✅ | ~75 min |
| 06 | 分层架构与分解漂移 | ✅ | ~60 min |
| 07 | 心智社会与多智能体辩论 | ✅ | ~75 min |
| 08 | 角色专精 — 规划者 / 评论者 / 执行者 / 验证者 | ✅ | ~75 min |
| 09 | 并行蜂群与网络化架构 | ✅ | ~60 min |
| 10 | 群聊与发言人选择 | ✅ | ~60 min |
| 11 | 移交与例程 (无状态编排) | ✅ | ~60 min |
| 12 | A2A — 智能体到智能体协议 | ✅ | ~75 min |
| 13 | 共享记忆与黑板模式 | ✅ | ~75 min |
| 14 | 面向智能体的共识与拜占庭容错 | ✅ | ~75 min |
| 15 | 投票、自洽性与辩论拓扑 | ✅ | ~75 min |
| 16 | 协商与议价 | ✅ | ~75 min |
| 17 | 生成式智能体与涌现式仿真 | ✅ | ~75 min |
| 18 | 心智理论与涌现式协调 | ✅ | ~75 min |
| 19 | 面向 LLM 的群体优化 (PSO、ACO) | ✅ | ~75 min |
| 20 | MARL — MADDPG、QMIX、MAPPO | ✅ | ~90 min |
| 21 | 智能体经济、token 激励、声誉 | ✅ | ~75 min |
| 22 | 生产级扩展 — 队列、检查点、持久性 | ✅ | ~75 min |
| 23 | 故障模式 — MAST、群体思维、单一文化、级联 | ✅ | ~75 min |
| 24 | 评估与协调基准 | ✅ | ~75 min |
| 25 | 案例研究与 2026 年最新进展 | ✅ | ~90 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 托管 LLM 平台 — Bedrock、Azure OpenAI、Vertex AI | ✅ | ~60 min |
| 02 | 推理平台经济学 — Fireworks、Together、Baseten、Modal | ✅ | ~60 min |
| 03 | Kubernetes 上的 GPU 自动扩缩 — Karpenter、KAI Scheduler | ✅ | ~75 min |
| 04 | vLLM 服务内部机制 — PagedAttention、连续批处理、分块预填充 | ✅ | ~75 min |
| 05 | 生产环境中的 EAGLE-3 推测解码 | ✅ | ~60 min |
| 06 | 面向前缀密集型负载的 SGLang 与 RadixAttention | ✅ | ~60 min |
| 07 | Blackwell 上用 FP8 与 NVFP4 的 TensorRT-LLM | ✅ | ~75 min |
| 08 | 推理指标 — TTFT、TPOT、ITL、Goodput、P99 | ✅ | ~60 min |
| 09 | 生产级量化 — AWQ、GPTQ、GGUF、FP8、NVFP4 | ✅ | ~75 min |
| 10 | 无服务器 LLM 的冷启动缓解 | ✅ | ~60 min |
| 11 | 多区域 LLM 服务与 KV 缓存局部性 | ✅ | ~60 min |
| 12 | 边缘推理 — ANE、Hexagon、WebGPU、Jetson | ✅ | ~60 min |
| 13 | LLM 可观测性技术栈选型 | ✅ | ~60 min |
| 14 | 提示缓存与语义缓存的经济学 | ✅ | ~60 min |
| 15 | 批处理 API — 50% 折扣作为行业标准 | ✅ | ~45 min |
| 16 | 把模型路由作为降本原语 | ✅ | ~60 min |
| 17 | 预填充/解码分离 — NVIDIA Dynamo 与 llm-d | ✅ | ~75 min |
| 18 | 带 LMCache KV 卸载的 vLLM 生产栈 | ✅ | ~60 min |
| 19 | AI 网关 — LiteLLM、Portkey、Kong、Bifrost | ✅ | ~60 min |
| 20 | 影子、金丝雀与渐进式部署 | ✅ | ~60 min |
| 21 | LLM 功能的 A/B 测试 — GrowthBook 与 Statsig | ✅ | ~60 min |
| 22 | LLM API 的负载测试 — k6、LLMPerf、GenAI-Perf | ✅ | ~75 min |
| 23 | 面向 AI 的 SRE — 多智能体事件响应 | ✅ | ~60 min |
| 24 | 面向 LLM 生产的混沌工程 | ✅ | ~60 min |
| 25 | 安全 — 密钥、PII 脱敏、审计日志 | ✅ | ~60 min |
| 26 | 合规 — SOC 2、HIPAA、GDPR、EU AI Act、ISO 42001 | ✅ | ~60 min |
| 27 | 面向 LLM 的 FinOps — 单位经济与多租户归因 | ✅ | ~60 min |
| 28 | 自托管服务选型 — llama.cpp、Ollama、TGI、vLLM、SGLang | ✅ | ~45 min |
| # | Lesson | Status | Est. |
|---|---|---|---|
| 01 | 指令遵循作为对齐信号 | ✅ | ~45 min |
| 02 | 奖励黑客与古德哈特定律 | ✅ | ~60 min |
| 03 | 直接偏好优化家族 | ✅ | ~60 min |
| 04 | 谄媚作为 RLHF 的放大效应 | ✅ | ~45 min |
| 05 | Constitutional AI 与 RLAIF | ✅ | ~60 min |
| 06 | Mesa 优化与欺骗性对齐 | ✅ | ~75 min |
| 07 | 潜伏智能体 — 持久性欺骗 | ✅ | ~60 min |
| 08 | 前沿模型中的上下文阴谋 | ✅ | ~60 min |
| 09 | 对齐伪装 | ✅ | ~60 min |
| 10 | AI 控制 — 颠覆之下仍保安全 | ✅ | ~75 min |
| 11 | 可扩展监督与弱到强泛化 | ✅ | ~60 min |
| 12 | 红队 — PAIR 与自动化攻击 | ✅ | ~75 min |
| 13 | 多样本越狱 | ✅ | ~45 min |
| 14 | ASCII 艺术与视觉越狱 | ✅ | ~60 min |
| 15 | 间接提示注入 | ✅ | ~75 min |
| 16 | 红队工具 — Garak、Llama Guard、PyRIT | ✅ | ~75 min |
| 17 | WMDP 与两用能力评估 | ✅ | ~60 min |
| 18 | 前沿安全框架 — RSP、PF、FSF | ✅ | ~75 min |
| 19 | 模型福祉研究 | ✅ | ~45 min |
| 20 | 偏见与表征伤害 | ✅ | ~60 min |
| 21 | 公平性准则 — 群体、个体、反事实 | ✅ | ~60 min |
| 22 | 面向 LLM 的差分隐私 | ✅ | ~60 min |
| 23 | 水印 — SynthID、Stable Signature、C2PA | ✅ | ~75 min |
| 24 | 监管框架 — 欧盟、美国、英国、韩国 | ✅ | ~75 min |
| 25 | EchoLeak 与面向 AI 的 CVE | ✅ | ~45 min |
| 26 | 模型卡、系统卡与数据集卡 | ✅ | ~60 min |
| 27 | 数据溯源与训练数据治理 | ✅ | ~60 min |
| 28 | 对齐研究生态 — MATS、Redwood、Apollo、METR | ✅ | ~45 min |
| 29 | 审核系统 — OpenAI、Perspective、Llama Guard | ✅ | ~60 min |
| 30 | 两用风险 — 网络、生物、化学、核 | ✅ | ~75 min |
总计:20 个阶段,503 节课 | 503 已完成 | 预计约 1100 小时
想出一份力?挑任意一节 ⬚ 课提交 PR。详见 CONTRIBUTING.md。