路线图

每个阶段、每节课的状态追踪表。本文件里的状态符号会喂给网站（site/build.js 会把它们解析进 site/data.js），别改它们的形状。

总预计时长：约 314 小时，按自己的节奏来。

图例： ✅ 已完成 · 🚧 进行中 · ⬚ 计划中

Phase 0: 配置与工具 — ✅ (~14 hours)

#	Lesson	Status	Est.
01	开发环境	✅	~75 min
02	Git 与协作	✅	~45 min
03	GPU 配置与云端	✅	~75 min
04	API 与密钥	✅	~75 min
05	Jupyter Notebook	✅	~75 min
06	Python 环境	✅	~75 min
07	面向 AI 的 Docker	✅	~75 min
08	编辑器配置	✅	~75 min
09	数据管理	✅	~75 min
10	终端与 Shell	✅	~45 min
11	面向 AI 的 Linux	✅	~45 min
12	调试与性能分析	✅	~75 min

Phase 1: 数学基础 — ✅ (~23 hours)

#	Lesson	Status	Est.
01	线性代数直觉	✅	~45 min
02	向量、矩阵与运算	✅	~75 min
03	矩阵变换与特征值	✅	~75 min
04	面向 ML 的微积分 — 导数与梯度	✅	~45 min
05	链式法则与自动微分	✅	~75 min
06	概率与分布	✅	~45 min
07	贝叶斯定理与统计思维	✅	~75 min
08	优化 — 梯度下降家族	✅	~75 min
09	信息论 — 熵、KL 散度	✅	~45 min
10	降维 — PCA、t-SNE、UMAP	✅	~75 min
11	奇异值分解	✅	~75 min
12	张量运算	✅	~75 min
13	数值稳定性	✅	~45 min
14	范数与距离	✅	~45 min
15	面向 ML 的统计学	✅	~45 min
16	采样方法	✅	~75 min
17	线性方程组	✅	~75 min
18	凸优化	✅	~75 min
19	面向 AI 的复数	✅	~45 min
20	傅里叶变换	✅	~75 min
21	面向 ML 的图论	✅	~45 min
22	随机过程	✅	~45 min

Phase 2: 机器学习基础 — ✅ (~21 hours)

#	Lesson	Status	Est.
01	什么是机器学习 — 类型与分类	✅	~45 min
02	从零实现线性回归	✅	~75 min
03	逻辑回归与分类	✅	~75 min
04	决策树与随机森林	✅	~75 min
05	支持向量机	✅	~75 min
06	K 近邻与距离度量	✅	~75 min
07	无监督学习 — K-Means、DBSCAN	✅	~75 min
08	特征工程与特征选择	✅	~75 min
09	模型评估 — 指标、交叉验证	✅	~75 min
10	偏差、方差与学习曲线	✅	~45 min
11	集成方法 — Boosting、Bagging、Stacking	✅	~75 min
12	超参数调优与 AutoML	✅	~75 min
13	ML 流水线与实验追踪	✅	~75 min
14	朴素贝叶斯 — 多项式、高斯、伯努利	✅	~75 min
15	时间序列基础	✅	~45 min
16	异常检测	✅	~75 min
17	处理不平衡数据	✅	~75 min
18	特征选择	✅	~75 min

Phase 3: 深度学习核心 — ✅ (~15 hours)

#	Lesson	Status	Est.
01	感知机 — 一切的起点	✅	~45 min
02	多层网络与前向传播	✅	~75 min
03	从零实现反向传播	✅	~75 min
04	激活函数 — ReLU、Sigmoid、GELU 及其原理	✅	~45 min
05	损失函数 — MSE、交叉熵、对比损失	✅	~45 min
06	优化器 — SGD、Momentum、Adam、AdamW	✅	~75 min
07	正则化 — Dropout、权重衰减、BatchNorm	✅	~75 min
08	权重初始化与训练稳定性	✅	~45 min
09	学习率调度与预热	✅	~45 min
10	打造你自己的迷你框架	✅	~120 min
11	PyTorch 入门	✅	~75 min
12	JAX 入门	✅	~75 min
13	调试神经网络	✅	~75 min

Phase 4: 计算机视觉 — ✅ (~27 hours)

#	Lesson	Status	Est.
01	图像基础 — 像素、通道、色彩空间	✅	~45 min
02	从零实现卷积	✅	~75 min
03	CNN — 从 LeNet 到 ResNet	✅	~75 min
04	图像分类	✅	~75 min
05	迁移学习与微调	✅	~75 min
06	目标检测 — 从零实现 YOLO	✅	~75 min
07	语义分割 — U-Net	✅	~75 min
08	实例分割 — Mask R-CNN	✅	~75 min
09	图像生成 — GAN	✅	~75 min
10	图像生成 — 扩散模型	✅	~75 min
11	Stable Diffusion — 架构与微调	✅	~75 min
12	视频理解 — 时序建模	✅	~45 min
13	3D 视觉 — 点云、NeRF	✅	~45 min
14	Vision Transformer (ViT)	✅	~45 min
15	实时视觉 — 边缘部署	✅	~75 min
16	构建完整的视觉流水线	✅	~120 min
17	自监督视觉 — SimCLR、DINO、MAE	✅	~75 min
18	开放词表视觉 — CLIP	✅	~45 min
19	OCR 与文档理解	✅	~45 min
20	图像检索与度量学习	✅	~45 min
21	关键点检测与姿态估计	✅	~45 min
22	从零实现 3D 高斯泼溅	✅	~90 min
23	扩散 Transformer 与整流流	✅	~75 min
24	SAM 3 与开放词表分割	✅	~60 min
25	视觉语言模型 (ViT-MLP-LLM)	✅	~75 min
26	单目深度与几何估计	✅	~60 min
27	多目标跟踪与视频记忆	✅	~60 min
28	世界模型与视频扩散	✅	~75 min

Phase 5: NLP — 从基础到进阶 — ✅ (~30 hours)

#	Lesson	Status	Est.
01	文本处理 — 分词、词干提取、词形还原	✅	~45 min
02	词袋、TF-IDF 与文本表示	✅	~75 min
03	词嵌入 — 从零实现 Word2Vec	✅	~75 min
04	GloVe、FastText 与子词嵌入	✅	~45 min
05	情感分析	✅	~75 min
06	命名实体识别 (NER)	✅	~75 min
07	词性标注与句法分析	✅	~45 min
08	文本分类 — 用于文本的 CNN 与 RNN	✅	~75 min
09	序列到序列模型	✅	~75 min
10	注意力机制 — 突破性进展	✅	~45 min
11	机器翻译	✅	~75 min
12	文本摘要	✅	~75 min
13	问答系统	✅	~75 min
14	信息检索与搜索	✅	~75 min
15	主题建模 — LDA、BERTopic	✅	~45 min
16	文本生成 — Transformer 之前的语言模型	✅	~45 min
17	聊天机器人 — 从规则驱动到神经网络	✅	~75 min
18	多语言 NLP	✅	~45 min
19	子词分词 — BPE、WordPiece、Unigram、SentencePiece	✅	~60 min
20	结构化输出与约束解码	✅	~60 min
21	自然语言推理与文本蕴含	✅	~60 min
22	嵌入模型深入剖析	✅	~60 min
23	面向 RAG 的分块策略	✅	~60 min
24	共指消解	✅	~60 min
25	实体链接与消歧	✅	~60 min
26	关系抽取与知识图谱构建	✅	~60 min
27	LLM 评估 — RAGAS、DeepEval、G-Eval	✅	~75 min
28	长上下文评估 — NIAH、RULER、LongBench、MRCR	✅	~60 min
29	对话状态追踪	✅	~75 min

Phase 6: 语音与音频 — ✅ (~18 hours)

#	Lesson	Status	Est.
01	音频基础 — 波形、采样、傅里叶变换	✅	~45 min
02	频谱图、梅尔标度与音频特征	✅	~45 min
03	音频分类	✅	~75 min
04	语音识别 (ASR)	✅	~45 min
05	Whisper — 架构与微调	✅	~75 min
06	说话人识别与验证	✅	~45 min
07	文本转语音 (TTS)	✅	~75 min
08	声音克隆与音色转换	✅	~75 min
09	音乐生成	✅	~75 min
10	音频语言模型	✅	~45 min
11	实时音频处理	✅	~75 min
12	构建语音助手流水线	✅	~120 min
13	神经音频编解码器 — EnCodec、SNAC、Mimi、DAC	✅	~60 min
14	语音活动检测与轮次切换	✅	~45 min
15	流式语音到语音 — Moshi、Hibiki	✅	~75 min
16	语音防伪与音频水印	✅	~75 min
17	音频评估 — WER、MOS、MMAU、排行榜	✅	~60 min

Phase 7: Transformer 深入剖析 — ✅ (~14 hours)

#	Lesson	Status	Est.
01	为什么需要 Transformer — RNN 的问题所在	✅	~45 min
02	从零实现自注意力	✅	~75 min
03	多头注意力	✅	~75 min
04	位置编码 — 正弦、RoPE、ALiBi	✅	~45 min
05	完整的 Transformer — 编码器 + 解码器	✅	~75 min
06	BERT — 掩码语言建模	✅	~45 min
07	GPT — 因果语言建模	✅	~75 min
08	T5、BART — 编码器-解码器模型	✅	~45 min
09	Vision Transformer (ViT)	✅	~45 min
10	音频 Transformer — Whisper 架构	✅	~45 min
11	混合专家 (MoE)	✅	~45 min
12	KV 缓存、Flash Attention 与推理优化	✅	~75 min
13	缩放定律	✅	~45 min
14	从零实现一个 Transformer — 总结项目	✅	~120 min
15	Attention 变体——滑动窗口、稀疏、差分	✅	~90 min
16	投机解码——草稿、验证、重复	✅	~90 min

Phase 8: 生成式 AI — ✅ (~14 hours)

#	Lesson	Status	Est.
01	生成模型 — 分类与历史	✅	~45 min
02	自编码器与 VAE	✅	~75 min
03	GAN — 生成器对判别器	✅	~75 min
04	条件 GAN 与 Pix2Pix	✅	~75 min
05	StyleGAN	✅	~45 min
06	扩散模型 — 从零实现 DDPM	✅	~75 min
07	潜在扩散与 Stable Diffusion	✅	~75 min
08	ControlNet、LoRA 与图像条件控制	✅	~75 min
09	图像修复、扩展与编辑	✅	~75 min
10	视频生成	✅	~45 min
11	音频生成	✅	~45 min
12	3D 生成	✅	~45 min
13	流匹配与整流流	✅	~45 min
14	评估 — FID、CLIP Score、人类偏好	✅	~45 min
19	视觉自回归建模（VAR）：下一尺度预测	✅	~90 min

Phase 9: 强化学习 — ✅ (~13 hours)

#	Lesson	Status	Est.
01	MDP、状态、动作与奖励	✅	~45 min
02	动态规划	✅	~75 min
03	蒙特卡洛方法	✅	~75 min
04	时序差分 — Q-Learning、SARSA	✅	~75 min
05	深度 Q 网络 (DQN)	✅	~75 min
06	策略梯度方法 — REINFORCE	✅	~75 min
07	Actor-Critic — A2C、A3C	✅	~75 min
08	近端策略优化 (PPO)	✅	~75 min
09	奖励建模与 RLHF	✅	~45 min
10	多智能体强化学习	✅	~45 min
11	从仿真到现实的迁移	✅	~45 min
12	游戏中的强化学习	✅	~75 min

Phase 10: 从零实现 LLM — ✅ (~26 hours)

#	Lesson	Status	Est.
01	分词器 — BPE、WordPiece、SentencePiece	✅	~45 min
02	从零实现一个分词器	✅	~75 min
03	预训练数据流水线	✅	~75 min
04	预训练一个迷你 GPT (124M)	✅	~120 min
05	扩展 — 分布式训练、FSDP、DeepSpeed	✅	~75 min
06	指令微调 — SFT	✅	~75 min
07	RLHF — 奖励模型 + PPO 训练	✅	~75 min
08	DPO — 直接偏好优化	✅	~75 min
09	Constitutional AI 与自我改进	✅	~45 min
10	评估 — 基准、Eval、LM Harness	✅	~75 min
11	量化 — INT8、GPTQ、AWQ、GGUF	✅	~75 min
12	推理优化	✅	~75 min
13	构建完整的 LLM 流水线	✅	~120 min
14	开源模型 — 架构逐步剖析	✅	~45 min
15	推测解码与 EAGLE-3	✅	~75 min
16	差分注意力 (V2)	✅	~60 min
17	原生稀疏注意力 (DeepSeek NSA)	✅	~60 min
18	多 token 预测 (MTP)	✅	~60 min
19	DualPipe 并行	✅	~60 min
20	DeepSeek-V3 架构逐步剖析	✅	~75 min
21	Jamba — 混合 SSM-Transformer	✅	~60 min
22	异步与 Hogwild! 推理	✅	~60 min
25	推测解码与 EAGLE	✅	~90 min
34	梯度检查点与激活重算	✅	~90 min

Phase 11: LLM 工程 — ✅ (~17 hours)

#	Lesson	Status	Est.
01	提示工程 — 技巧与模式	✅	~45 min
02	少样本、思维链、思维树	✅	~45 min
03	结构化输出	✅	~75 min
04	嵌入与向量表示	✅	~75 min
05	上下文工程	✅	~75 min
06	RAG — 检索增强生成	✅	~75 min
07	进阶 RAG	✅	~75 min
08	用 LoRA 与 QLoRA 微调	✅	~75 min
09	函数调用与工具使用	✅	~75 min
10	评估与测试 LLM 应用	✅	~45 min
11	缓存、限流与成本优化	✅	~45 min
12	护栏、安全与内容过滤	✅	~45 min
13	构建生产级 LLM 应用	✅	~120 min
14	模型上下文协议 (MCP)	✅	~75 min
15	提示缓存与上下文缓存	✅	~60 min

Phase 12: 多模态 AI — ✅ (~65 hours)

#	Lesson	Status	Est.
01	Vision Transformer 与图块-token 原语	✅	~120 min
02	CLIP 与对比式视觉语言预训练	✅	~180 min
03	BLIP-2 与作为模态桥梁的 Q-Former	✅	~180 min
04	Flamingo 与门控交叉注意力	✅	~120 min
05	LLaVA 与视觉指令微调	✅	~180 min
06	任意分辨率视觉：Patch-n'-Pack 与 NaFlex	✅	~120 min
07	开源权重 VLM 配方：真正重要的是什么	✅	~180 min
08	LLaVA-OneVision：单图、多图、视频	✅	~180 min
09	Qwen-VL 家族与动态帧率视频	✅	~120 min
10	InternVL3 原生多模态预训练	✅	~120 min
11	Chameleon 与早融合纯 token	✅	~180 min
12	Emu3 用下一 token 预测做生成	✅	~120 min
13	Transfusion 自回归 + 扩散	✅	~180 min
14	Show-o 与离散扩散统一	✅	~120 min
15	Janus-Pro 解耦编码器	✅	~120 min
16	MIO 任意到任意流式处理	✅	~120 min
17	视频语言时序定位	✅	~180 min
18	百万 token 上下文下的长视频理解	✅	~180 min
19	音频语言模型：从 Whisper 到 AF3	✅	~180 min
20	全模态模型：Thinker-Talker	✅	~180 min
21	具身 VLA：RT-2、OpenVLA、π0、GR00T	✅	~180 min
22	文档与图表理解	✅	~180 min
23	ColPali 视觉原生文档 RAG	✅	~180 min
24	多模态 RAG 与跨模态检索	✅	~180 min
25	多模态智能体与计算机操作 (总结项目)	✅	~240 min

Phase 13: 工具与协议 — ✅ (~24.5 hours)

#	Lesson	Status	Est.
01	工具接口	✅	~45 min
02	函数调用深入剖析	✅	~75 min
03	并行与流式工具调用	✅	~75 min
04	结构化输出	✅	~75 min
05	工具 Schema 设计	✅	~45 min
06	MCP 基础	✅	~45 min
07	构建一个 MCP Server	✅	~75 min
08	构建一个 MCP Client	✅	~75 min
09	MCP 传输层	✅	~45 min
10	MCP 资源与 Prompt	✅	~45 min
11	MCP Sampling	✅	~75 min
12	MCP Roots 与 Elicitation	✅	~45 min
13	MCP 异步任务	✅	~75 min
14	MCP Apps	✅	~75 min
15	MCP 安全 I — 工具投毒	✅	~45 min
16	MCP 安全 II — OAuth 2.1	✅	~75 min
17	MCP 网关与注册中心	✅	~45 min
18	生产环境中的 MCP 认证 — iii 上的 DCR + JWKS	✅	~90 min
19	A2A 协议	✅	~75 min
20	OpenTelemetry GenAI	✅	~75 min
21	LLM 路由层	✅	~45 min
22	Skill 与 Agent SDK	✅	~45 min
23	总结项目 — 工具生态系统	✅	~120 min

Phase 14: 智能体工程 — ✅ (~42 hours)

#	Lesson	Status	Est.
01	智能体循环	✅	~60 min
02	ReWOO 与规划-执行	✅	~60 min
03	Reflexion 与言语强化学习	✅	~60 min
04	思维树与 LATS	✅	~75 min
05	Self-Refine 与 CRITIC	✅	~60 min
06	工具使用与函数调用	✅	~60 min
07	记忆 — 虚拟上下文与 MemGPT	✅	~75 min
08	记忆块与睡眠时计算 (Letta)	✅	~75 min
09	混合记忆 — 向量 + 图 + KV (Mem0)	✅	~75 min
10	技能库与终身学习 (Voyager)	✅	~75 min
11	用 HTN 与进化搜索做规划	✅	~75 min
12	Anthropic 的工作流模式	✅	~60 min
13	LangGraph — 有状态图与持久化执行	✅	~75 min
14	AutoGen v0.4 — Actor 模型	✅	~75 min
15	CrewAI — 基于角色的团队与流程	✅	~60 min
16	OpenAI Agents SDK — 移交、护栏、追踪	✅	~75 min
17	Claude Agent SDK — 子智能体与会话存储	✅	~75 min
18	Agno 与 Mastra — 生产级运行时	✅	~45 min
19	基准 — SWE-bench、GAIA、AgentBench	✅	~60 min
20	基准 — WebArena 与 OSWorld	✅	~60 min
21	计算机操作 — Claude、OpenAI CUA、Gemini	✅	~60 min
22	语音智能体 — Pipecat 与 LiveKit	✅	~60 min
23	OpenTelemetry GenAI 语义约定	✅	~60 min
24	智能体可观测性 — Langfuse、Phoenix、Opik	✅	~45 min
25	多智能体辩论与协作	✅	~60 min
26	故障模式 — 智能体为何崩溃	✅	~60 min
27	提示注入与 PVE 防御	✅	~75 min
28	编排模式 — 主管、蜂群、分层	✅	~60 min
29	生产级运行时 — 队列、事件、定时任务	✅	~60 min
30	评估驱动的智能体开发	✅	~60 min
31	智能体工作台：能力强的模型为何仍会失败	✅	~45 min
32	最小智能体工作台	✅	~45 min
33	把智能体指令写成可执行的约束	✅	~50 min
34	仓库记忆与持久化状态	✅	~60 min
35	智能体的初始化脚本	✅	~45 min
36	范围契约与任务边界	✅	~50 min
37	运行时反馈循环	✅	~50 min
38	验证关卡	✅	~55 min
39	审查智能体：把构建者和评分者分开	✅	~55 min
40	多会话交接	✅	~50 min
41	在真实仓库上跑工作台	✅	~60 min
42	总结项目：交付一个可复用的智能体工作台包	✅	~75 min

Phase 15: 自主系统 — ✅ (~20 hours)

#	Lesson	Status	Est.
01	从聊天机器人到长时程智能体 (METR)	✅	~45 min
02	STaR、V-STaR、Quiet-STaR — 自学推理	✅	~60 min
03	AlphaEvolve — 进化式编码智能体	✅	~60 min
04	Darwin Gödel Machine — 自我修改智能体	✅	~60 min
05	AI Scientist v2 — 研讨会级研究	✅	~60 min
06	自动化对齐研究 (Anthropic AAR)	✅	~60 min
07	递归自我改进 — 能力对齐之争	✅	~60 min
08	有界自我改进设计	✅	~60 min
09	自主编码智能体全景 (SWE-bench、CodeAct)	✅	~45 min
10	Claude Code 权限模式与自动模式	✅	~45 min
11	浏览器智能体与间接提示注入	✅	~45 min
12	长时运行智能体的持久化执行	✅	~60 min
13	动作预算、迭代上限、成本调控器	✅	~60 min
14	急停开关、熔断器、金丝雀 token	✅	~60 min
15	HITL — 先提议后提交	✅	~60 min
16	检查点与回滚	✅	~60 min
17	Constitutional AI 与规则覆盖	✅	~60 min
18	Llama Guard 与输入/输出分类	✅	~45 min
19	Anthropic 负责任扩展政策 v3.0	✅	~45 min
20	OpenAI 准备框架与 DeepMind FSF	✅	~45 min
21	METR 时间跨度与外部评估	✅	~60 min
22	CAIS、CAISI 与社会尺度风险	✅	~45 min

Phase 16: 多智能体与蜂群 — ✅ (~28 hours)

#	Lesson	Status	Est.
01	为什么需要多智能体	✅	~45 min
02	FIPA-ACL 传承与言语行为	✅	~60 min
03	通信协议	✅	~45 min
04	多智能体原语模型	✅	~60 min
05	主管 / 编排器-工作者模式	✅	~75 min
06	分层架构与分解漂移	✅	~60 min
07	心智社会与多智能体辩论	✅	~75 min
08	角色专精 — 规划者 / 评论者 / 执行者 / 验证者	✅	~75 min
09	并行蜂群与网络化架构	✅	~60 min
10	群聊与发言人选择	✅	~60 min
11	移交与例程 (无状态编排)	✅	~60 min
12	A2A — 智能体到智能体协议	✅	~75 min
13	共享记忆与黑板模式	✅	~75 min
14	面向智能体的共识与拜占庭容错	✅	~75 min
15	投票、自洽性与辩论拓扑	✅	~75 min
16	协商与议价	✅	~75 min
17	生成式智能体与涌现式仿真	✅	~75 min
18	心智理论与涌现式协调	✅	~75 min
19	面向 LLM 的群体优化 (PSO、ACO)	✅	~75 min
20	MARL — MADDPG、QMIX、MAPPO	✅	~90 min
21	智能体经济、token 激励、声誉	✅	~75 min
22	生产级扩展 — 队列、检查点、持久性	✅	~75 min
23	故障模式 — MAST、群体思维、单一文化、级联	✅	~75 min
24	评估与协调基准	✅	~75 min
25	案例研究与 2026 年最新进展	✅	~90 min

Phase 17: 基础设施与生产 — ✅ (~32 hours)

#	Lesson	Status	Est.
01	托管 LLM 平台 — Bedrock、Azure OpenAI、Vertex AI	✅	~60 min
02	推理平台经济学 — Fireworks、Together、Baseten、Modal	✅	~60 min
03	Kubernetes 上的 GPU 自动扩缩 — Karpenter、KAI Scheduler	✅	~75 min
04	vLLM 服务内部机制 — PagedAttention、连续批处理、分块预填充	✅	~75 min
05	生产环境中的 EAGLE-3 推测解码	✅	~60 min
06	面向前缀密集型负载的 SGLang 与 RadixAttention	✅	~60 min
07	Blackwell 上用 FP8 与 NVFP4 的 TensorRT-LLM	✅	~75 min
08	推理指标 — TTFT、TPOT、ITL、Goodput、P99	✅	~60 min
09	生产级量化 — AWQ、GPTQ、GGUF、FP8、NVFP4	✅	~75 min
10	无服务器 LLM 的冷启动缓解	✅	~60 min
11	多区域 LLM 服务与 KV 缓存局部性	✅	~60 min
12	边缘推理 — ANE、Hexagon、WebGPU、Jetson	✅	~60 min
13	LLM 可观测性技术栈选型	✅	~60 min
14	提示缓存与语义缓存的经济学	✅	~60 min
15	批处理 API — 50% 折扣作为行业标准	✅	~45 min
16	把模型路由作为降本原语	✅	~60 min
17	预填充/解码分离 — NVIDIA Dynamo 与 llm-d	✅	~75 min
18	带 LMCache KV 卸载的 vLLM 生产栈	✅	~60 min
19	AI 网关 — LiteLLM、Portkey、Kong、Bifrost	✅	~60 min
20	影子、金丝雀与渐进式部署	✅	~60 min
21	LLM 功能的 A/B 测试 — GrowthBook 与 Statsig	✅	~60 min
22	LLM API 的负载测试 — k6、LLMPerf、GenAI-Perf	✅	~75 min
23	面向 AI 的 SRE — 多智能体事件响应	✅	~60 min
24	面向 LLM 生产的混沌工程	✅	~60 min
25	安全 — 密钥、PII 脱敏、审计日志	✅	~60 min
26	合规 — SOC 2、HIPAA、GDPR、EU AI Act、ISO 42001	✅	~60 min
27	面向 LLM 的 FinOps — 单位经济与多租户归因	✅	~60 min
28	自托管服务选型 — llama.cpp、Ollama、TGI、vLLM、SGLang	✅	~45 min

Phase 18: 伦理、安全与对齐 — ✅ (~31 hours)

#	Lesson	Status	Est.
01	指令遵循作为对齐信号	✅	~45 min
02	奖励黑客与古德哈特定律	✅	~60 min
03	直接偏好优化家族	✅	~60 min
04	谄媚作为 RLHF 的放大效应	✅	~45 min
05	Constitutional AI 与 RLAIF	✅	~60 min
06	Mesa 优化与欺骗性对齐	✅	~75 min
07	潜伏智能体 — 持久性欺骗	✅	~60 min
08	前沿模型中的上下文阴谋	✅	~60 min
09	对齐伪装	✅	~60 min
10	AI 控制 — 颠覆之下仍保安全	✅	~75 min
11	可扩展监督与弱到强泛化	✅	~60 min
12	红队 — PAIR 与自动化攻击	✅	~75 min
13	多样本越狱	✅	~45 min
14	ASCII 艺术与视觉越狱	✅	~60 min
15	间接提示注入	✅	~75 min
16	红队工具 — Garak、Llama Guard、PyRIT	✅	~75 min
17	WMDP 与两用能力评估	✅	~60 min
18	前沿安全框架 — RSP、PF、FSF	✅	~75 min
19	模型福祉研究	✅	~45 min
20	偏见与表征伤害	✅	~60 min
21	公平性准则 — 群体、个体、反事实	✅	~60 min
22	面向 LLM 的差分隐私	✅	~60 min
23	水印 — SynthID、Stable Signature、C2PA	✅	~75 min
24	监管框架 — 欧盟、美国、英国、韩国	✅	~75 min
25	EchoLeak 与面向 AI 的 CVE	✅	~45 min
26	模型卡、系统卡与数据集卡	✅	~60 min
27	数据溯源与训练数据治理	✅	~60 min
28	对齐研究生态 — MATS、Redwood、Apollo、METR	✅	~45 min
29	审核系统 — OpenAI、Perspective、Llama Guard	✅	~60 min
30	两用风险 — 网络、生物、化学、核	✅	~75 min

Phase 19: 总结项目 — ✅ (~800 hours)

#	Project	Status	Est.
01	终端原生编码智能体	✅	~35 hr
02	面向代码库的 RAG (跨仓库语义搜索)	✅	~30 hr
03	实时语音助手 (ASR 到 LLM 到 TTS)	✅	~30 hr
04	多模态文档问答 (视觉优先)	✅	~30 hr
05	自主研究智能体 (AI-Scientist 级)	✅	~40 hr
06	面向 Kubernetes 的 DevOps 排障智能体	✅	~30 hr
07	端到端微调流水线	✅	~35 hr
08	生产级 RAG 聊天机器人 (受监管垂直领域)	✅	~30 hr
09	代码迁移智能体 (仓库级升级)	✅	~30 hr
10	多智能体软件工程团队	✅	~40 hr
11	LLM 可观测性与评估仪表盘	✅	~25 hr
12	视频理解流水线 (场景到问答)	✅	~30 hr
13	带注册中心与治理的 MCP Server	✅	~25 hr
14	推测解码推理服务器	✅	~30 hr
15	Constitutional 安全护栏 + 红队靶场	✅	~25 hr
16	GitHub Issue 到 PR 的自主智能体	✅	~30 hr
17	个人 AI 导师 (自适应、多模态)	✅	~30 hr
20	Agent Harness Loop 契约	✅	~90 min
21	带 Schema 校验的 Tool Registry	✅	~90 min
22	基于换行分隔 stdio 的 JSON-RPC 2.0	✅	~90 min
23	Function Call Dispatcher	✅	~90 min
24	Plan-Execute 控制流	✅	~90 min
25	Verification Gate 与 Observation Budget	✅	~90 min
26	带 Denylist 与 Path Jail 的 Sandbox Runner	✅	~90 min
27	带 Fixture Tasks 的 Eval Harness	✅	~90 min
28	用 OTel GenAI Span 与 Prometheus 做 Observability	✅	~90 min
29	端到端 Coding Agent Demo	✅	~90 min
30	从零实现 BPE Tokenizer	✅	~90 min
31	带 Sliding Window 的 Tokenized Dataset	✅	~90 min
32	Token Embedding 与 Positional Embedding	✅	~90 min
33	Multi-Head Self-Attention	✅	~90 min
34	从零实现 Transformer Block	✅	~90 min
35	GPT 模型组装	✅	~90 min
36	训练循环与评估	✅	~90 min
37	加载预训练权重	✅	~90 min
38	通过换 Head 做分类微调	✅	~90 min
39	通过 SFT 做 Instruction Tuning	✅	~90 min
40	从零实现 DPO	✅	~90 min
41	完整评估流水线	✅	~90 min
42	大规模语料下载器	✅	~90 min
43	HDF5 Tokenized Corpus	✅	~90 min
44	Cosine 学习率 + 线性 Warmup	✅	~90 min
45	Gradient Clipping 与混合精度训练	✅	~90 min
46	梯度累积	✅	~90 min
47	Checkpoint 保存与恢复	✅	~90 min
48	从零实现分布式数据并行与 FSDP	✅	~90 min
49	语言模型评测框架	✅	~90 min
50	假设生成器	✅	~90 min
51	文献检索	✅	~90 min
52	实验执行器	✅	~90 min
53	结果评估器	✅	~90 min
54	论文生成器	✅	~90 min
55	评审循环	✅	~90 min
56	迭代调度器	✅	~90 min
57	端到端研究 Demo	✅	~90 min
58	Vision Encoder 的 Patch 切分	✅	~90 min
59	Vision Transformer Encoder（ViT）	✅	~90 min
60	用 Projection Layer 做模态对齐	✅	~90 min
61	Cross-Attention 融合	✅	~90 min
62	Vision-Language 预训练	✅	~90 min
63	多模态评测	✅	~90 min
64	Chunking 策略横向对比	✅	~90 min
65	用 BM25 与 Dense Embedding 做 Hybrid Retrieval	✅	~90 min
66	Cross-Encoder Reranker	✅	~90 min
67	Query 改写：HyDE、Multi-Query 与 Decomposition	✅	~90 min
68	RAG 评测：Precision、Recall、MRR、nDCG 等	✅	~90 min
69	端到端 RAG 系统	✅	~90 min
70	任务规格格式	✅	~90 min
71	经典评测指标	✅	~90 min
72	代码执行评测指标	✅	~90 min
73	perplexity 与 calibration	✅	~90 min
74	leaderboard 聚合	✅	~90 min
75	端到端 eval runner	✅	~90 min
76	从零实现集合通信	✅	~90 min
77	数据并行 DDP	✅	~90 min
78	ZeRO Optimizer State 分片	✅	~90 min
79	Pipeline Parallel 与 Bubble 分析	✅	~90 min
80	分片 Checkpoint 与原子化恢复	✅	~90 min
81	端到端分布式训练	✅	~90 min
82	越狱分类法	✅	~90 min
83	Prompt 注入检测器	✅	~90 min
84	拒答评估	✅	~90 min
85	内容分类器集成	✅	~90 min
86	Constitutional 规则引擎	✅	~90 min
87	端到端 safety gate	✅	~90 min

总计：20 个阶段，503 节课 | 503 已完成 | 预计约 1100 小时

想出一份力？挑任意一节 ⬚ 课提交 PR。详见 CONTRIBUTING.md。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

路线图

Phase 0: 配置与工具 — ✅ (~14 hours)

Phase 1: 数学基础 — ✅ (~23 hours)

Phase 2: 机器学习基础 — ✅ (~21 hours)

Phase 3: 深度学习核心 — ✅ (~15 hours)

Phase 4: 计算机视觉 — ✅ (~27 hours)

Phase 5: NLP — 从基础到进阶 — ✅ (~30 hours)

Phase 6: 语音与音频 — ✅ (~18 hours)

Phase 7: Transformer 深入剖析 — ✅ (~14 hours)

Phase 8: 生成式 AI — ✅ (~14 hours)

Phase 9: 强化学习 — ✅ (~13 hours)

Phase 10: 从零实现 LLM — ✅ (~26 hours)

Phase 11: LLM 工程 — ✅ (~17 hours)

Phase 12: 多模态 AI — ✅ (~65 hours)

Phase 13: 工具与协议 — ✅ (~24.5 hours)

Phase 14: 智能体工程 — ✅ (~42 hours)

Phase 15: 自主系统 — ✅ (~20 hours)

Phase 16: 多智能体与蜂群 — ✅ (~28 hours)

Phase 17: 基础设施与生产 — ✅ (~32 hours)

Phase 18: 伦理、安全与对齐 — ✅ (~31 hours)

Phase 19: 总结项目 — ✅ (~800 hours)

FilesExpand file tree

ROADMAP.md

Latest commit

History

ROADMAP.md

File metadata and controls

路线图

Phase 0: 配置与工具 — ✅ (~14 hours)

Phase 1: 数学基础 — ✅ (~23 hours)

Phase 2: 机器学习基础 — ✅ (~21 hours)

Phase 3: 深度学习核心 — ✅ (~15 hours)

Phase 4: 计算机视觉 — ✅ (~27 hours)

Phase 5: NLP — 从基础到进阶 — ✅ (~30 hours)

Phase 6: 语音与音频 — ✅ (~18 hours)

Phase 7: Transformer 深入剖析 — ✅ (~14 hours)

Phase 8: 生成式 AI — ✅ (~14 hours)

Phase 9: 强化学习 — ✅ (~13 hours)

Phase 10: 从零实现 LLM — ✅ (~26 hours)

Phase 11: LLM 工程 — ✅ (~17 hours)

Phase 12: 多模态 AI — ✅ (~65 hours)

Phase 13: 工具与协议 — ✅ (~24.5 hours)

Phase 14: 智能体工程 — ✅ (~42 hours)

Phase 15: 自主系统 — ✅ (~20 hours)

Phase 16: 多智能体与蜂群 — ✅ (~28 hours)

Phase 17: 基础设施与生产 — ✅ (~32 hours)

Phase 18: 伦理、安全与对齐 — ✅ (~31 hours)

Phase 19: 总结项目 — ✅ (~800 hours)