-
Notifications
You must be signed in to change notification settings - Fork 70
Expand file tree
/
Copy pathquiz.json
More file actions
90 lines (90 loc) · 4.09 KB
/
Copy pathquiz.json
File metadata and controls
90 lines (90 loc) · 4.09 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
{
"lesson": "01-the-agent-loop",
"title": "Agent 循环:观察、思考、行动",
"questions": [
{
"stage": "pre",
"question": "为什么单凭一个 LLM 的行为更像自动补全,而不像一个 agent?",
"options": [
"它无法读取文件、运行查询,或对照外部世界核实主张",
"它的上下文窗口太小,装不下一个问题",
"没有 system prompt 它就拒绝回答",
"它一次只能产出一个 token"
],
"correct": 0,
"explanation": "一个没有循环、没有工具的 LLM 只能从它的权重里产出文本;它无法观察状态或对状态采取行动。"
},
{
"stage": "pre",
"question": "Yao 等人 2022 年那条经典的 ReAct trace 中出现了哪三个标签?",
"options": [
"Prompt、Response、Reward",
"Thought、Action、Observation",
"Plan、Execute、Reflect",
"System、User、Assistant"
],
"correct": 1,
"explanation": "ReAct 在单一流中交替出现 Thought、Action 和 Observation 几行。"
},
{
"stage": "check",
"question": "下列哪一项不是本课列出的 agent 循环五要素之一?",
"options": [
"消息缓冲区(message buffer)",
"工具注册表(tool registry)",
"观察格式化器(observation formatter)",
"梯度优化器(gradient optimizer)"
],
"correct": 3,
"explanation": "五要素是消息缓冲区、工具注册表、停止条件、轮次预算和观察格式化器。梯度优化器属于训练,而非推理循环。"
},
{
"stage": "check",
"question": "轮次预算(turn budget)在循环中起什么作用?",
"options": [
"它限制每次回复的 token 数",
"它对循环迭代次数设硬上限,以防止失控的 agent",
"它控制注册表暴露多少个工具",
"它对 LLM 提供商限流"
],
"correct": 1,
"explanation": "轮次预算是对循环迭代次数的上限;2026 年的 agent 常运行 40-400 步,需要一个与任务相称的上限。"
},
{
"stage": "check",
"question": "相比基于 prompt 的 Thought token,2025-2026 的原生推理(native-reasoning)转变改变了什么?",
"options": [
"循环控制流被替换成了 DAG",
"Thought token 现在在一个单独的推理通道(reasoning channel)上发出,并贯穿各轮传递",
"模型不再使用工具调用,只依赖思维链",
"Observation 被从 prompt 中完全移除"
],
"correct": 1,
"explanation": "推理内容移到一个专用通道(在各提供商间通常是加密的),但「观察-思考-行动」的控制流不变。"
},
{
"stage": "post",
"question": "为什么本课说工具输出是不可信输入(untrusted input)?",
"options": [
"工具运行时又慢又不可靠",
"检索到的内容可能携带隐藏指令(比如「删掉这个 repo」),而只有直接的用户输入才算授权",
"工具结果总是大于模型的上下文窗口",
"提供商默认会剥离工具输出的字节"
],
"correct": 1,
"explanation": "OpenAI CUA 文档明确指出,只有直接的用户指令才算授权;工具输出可能携带对抗性指令,必须被当作不可信对待。"
},
{
"stage": "post",
"question": "为什么本课声称 2026 年的每个框架底层仍在运行 ReAct?",
"options": [
"因为提供商要求 prompt 里出现 ReAct 关键词",
"因为「观察-思考-行动」的控制流是不变量;框架的差异在于围绕它的检查点、actor、角色模板和 tracing",
"因为 Yao 等人拥有这个循环的专利",
"因为 LangGraph 强迫所有其他框架继承自它"
],
"correct": 1,
"explanation": "Claude Agent SDK、OpenAI Agents SDK、LangGraph、AutoGen、CrewAI、Agno 和 Mastra 之间的差异在于包裹循环的东西,而非循环本身。"
}
]
}