-
Notifications
You must be signed in to change notification settings - Fork 37
Expand file tree
/
Copy pathquiz.json
More file actions
78 lines (78 loc) · 3.43 KB
/
Copy pathquiz.json
File metadata and controls
78 lines (78 loc) · 3.43 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
{
"lesson": "57-end-to-end-research-demo",
"title": "顶点课 57 —— 端到端研究 Demo",
"questions": [
{
"stage": "pre",
"question": "这节课里 demo 的职责是什么?",
"options": [
"用一个全新框架替换之前的课程",
"通过普通的 Python import 把前面课程中的基元组合起来",
"拿调度器和一个 baseline 做基准测试",
"在每个分支上调用真实的语言模型"
],
"correct": 1,
"explanation": "demo 是一次组合测试。每个阶段存在于自己的课程中。demo 导入它们并组装报告。没有新框架,没有新抽象。"
},
{
"stage": "pre",
"question": "为什么这节课用 importlib 加载前面的课程,而不是普通的 package import?",
"options": [
"因为 importlib 更快",
"因为每节前置课程是独立的 code/ 文件夹,不是已安装的 package;importlib 按文件路径加载它们",
"因为 asyncio 要求 importlib",
"因为各课程共享模块名会冲突"
],
"correct": 1,
"explanation": "各课程不是已安装的 package。每节课在自己的 code/ 文件夹里有一个 main.py。importlib.util.spec_from_file_location 按路径加载它们,不会污染全局模块命名空间。"
},
{
"stage": "check",
"question": "当多个分支都触发了论文生成时,最佳结果选择器如何决定?",
"options": [
"选运行实验最多的分支",
"选均值奖励最高的分支,平局时按 branch id 字母序打破",
"随机选择以保证公平",
"选第一个触发的分支"
],
"correct": 1,
"explanation": "最高均值胜出。平局按 branch id 打破,保证 demo 的确定性。随机选择会破坏确定性测试。"
},
{
"stage": "check",
"question": "当调度器报告零次论文触发时,选择器抛出什么错误?",
"options": [
"ValueError",
"NoTriggerError,在 writer 运行之前就短路了 demo",
"PaperValidationError",
"返回 None"
],
"correct": 1,
"explanation": "NoTriggerError 是类型化的失败模式。返回 None 会让 writer 在畸形输入上运行,然后在后面以更难定位的错误失败。"
},
{
"stage": "post",
"question": "为什么 demo 在确定性测试中用相同种子运行两次?",
"options": [
"为了执行两次 asyncio",
"为了断言两次运行中选中的分支、奖励和论文 section id 完全一致",
"为了检测内存泄漏",
"为了证明调度器是公平的"
],
"correct": 1,
"explanation": "确定性是契约的一部分。用相同种子的两次运行必须产出相同的产物。这个测试锁定了这一点。"
},
{
"stage": "post",
"question": "成功运行后,demo 报告包含什么?",
"options": [
"仅最终 LaTeX 文件",
"scheduler_report、best_branch、best_reward、critic_result、paper_manifest 和 stop_reason",
"仅实验数量和一个状态字符串",
"模型 prompt 和 completion 日志"
],
"correct": 1,
"explanation": "每个阶段的输出都保留了下来。报告是上游输出的组合,不是变换后的摘要。下游工具读 manifest;调试人员读 scheduler_report 里的 trace。"
}
]
}