ai-engineering-from-scratch-zh/phases/14-agent-engineering/01-the-agent-loop/quiz.json at main · fancyboi999/ai-engineering-from-scratch-zh · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
{
  "lesson": "01-the-agent-loop",
  "title": "Agent 循环：观察、思考、行动",
  "questions": [
    {
      "stage": "pre",
      "question": "为什么单凭一个 LLM 的行为更像自动补全，而不像一个 agent？",
      "options": [
        "它无法读取文件、运行查询，或对照外部世界核实主张",
        "它的上下文窗口太小，装不下一个问题",
        "没有 system prompt 它就拒绝回答",
        "它一次只能产出一个 token"
      ],
      "correct": 0,
      "explanation": "一个没有循环、没有工具的 LLM 只能从它的权重里产出文本；它无法观察状态或对状态采取行动。"
    },
    {
      "stage": "pre",
      "question": "Yao 等人 2022 年那条经典的 ReAct trace 中出现了哪三个标签？",
      "options": [
        "Prompt、Response、Reward",
        "Thought、Action、Observation",
        "Plan、Execute、Reflect",
        "System、User、Assistant"
      ],
      "correct": 1,
      "explanation": "ReAct 在单一流中交替出现 Thought、Action 和 Observation 几行。"
    },
    {
      "stage": "check",
      "question": "下列哪一项不是本课列出的 agent 循环五要素之一？",
      "options": [
        "消息缓冲区（message buffer）",
        "工具注册表（tool registry）",
        "观察格式化器（observation formatter）",
        "梯度优化器（gradient optimizer）"
      ],
      "correct": 3,
      "explanation": "五要素是消息缓冲区、工具注册表、停止条件、轮次预算和观察格式化器。梯度优化器属于训练，而非推理循环。"
    },
    {
      "stage": "check",
      "question": "轮次预算（turn budget）在循环中起什么作用？",
      "options": [
        "它限制每次回复的 token 数",
        "它对循环迭代次数设硬上限，以防止失控的 agent",
        "它控制注册表暴露多少个工具",
        "它对 LLM 提供商限流"
      ],
      "correct": 1,
      "explanation": "轮次预算是对循环迭代次数的上限；2026 年的 agent 常运行 40-400 步，需要一个与任务相称的上限。"
    },
    {
      "stage": "check",
      "question": "相比基于 prompt 的 Thought token，2025-2026 的原生推理（native-reasoning）转变改变了什么？",
      "options": [
        "循环控制流被替换成了 DAG",
        "Thought token 现在在一个单独的推理通道（reasoning channel）上发出，并贯穿各轮传递",
        "模型不再使用工具调用，只依赖思维链",
        "Observation 被从 prompt 中完全移除"
      ],
      "correct": 1,
      "explanation": "推理内容移到一个专用通道（在各提供商间通常是加密的），但「观察-思考-行动」的控制流不变。"
    },
    {
      "stage": "post",
      "question": "为什么本课说工具输出是不可信输入（untrusted input）？",
      "options": [
        "工具运行时又慢又不可靠",
        "检索到的内容可能携带隐藏指令（比如「删掉这个 repo」），而只有直接的用户输入才算授权",
        "工具结果总是大于模型的上下文窗口",
        "提供商默认会剥离工具输出的字节"
      ],
      "correct": 1,
      "explanation": "OpenAI CUA 文档明确指出，只有直接的用户指令才算授权；工具输出可能携带对抗性指令，必须被当作不可信对待。"
    },
    {
      "stage": "post",
      "question": "为什么本课声称 2026 年的每个框架底层仍在运行 ReAct？",
      "options": [
        "因为提供商要求 prompt 里出现 ReAct 关键词",
        "因为「观察-思考-行动」的控制流是不变量；框架的差异在于围绕它的检查点、actor、角色模板和 tracing",
        "因为 Yao 等人拥有这个循环的专利",
        "因为 LangGraph 强迫所有其他框架继承自它"
      ],
      "correct": 1,
      "explanation": "Claude Agent SDK、OpenAI Agents SDK、LangGraph、AutoGen、CrewAI、Agno 和 Mastra 之间的差异在于包裹循环的东西，而非循环本身。"
    }
  ]
}