ai-engineering-from-scratch-zh/phases/16-multi-agent-and-swarms/01-why-multi-agent/quiz.json at main · fancyboi999/ai-engineering-from-scratch-zh · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
{
  "questions": [
    {
      "stage": "pre",
      "question": "什么是「单 agent 天花板」？",
      "options": ["单个 agent 能使用的工具数量上限", "当任务超出单个上下文窗口、需要不同领域的专长、或需要并行作业时，单个 agent 就会失效的临界点", "单个 agent 每分钟能发起的 API 调用次数上限", "能在单块 GPU 上运行的最大模型尺寸"],
      "correct": 1,
      "explanation": "单个 agent 只有一个上下文窗口、一个系统提示，并且是顺序处理的。当任务需要读取 50 个文件（上下文溢出）、在研究与编码之间来回切换（混合专长）、或同时进行多项独立工作（并行）时，单个 agent 就会崩溃。"
    },
    {
      "stage": "pre",
      "question": "为什么要用多个专精的 agent，而不是一个强大的通用 agent？",
      "options": ["多个 agent 总是比单个大模型更便宜", "每个 agent 都可以拥有聚焦的系统提示、更小的上下文以及专用工具，从而在各自的子任务上表现更好", "多个 agent 可以共享同一个上下文窗口", "通用 agent 无法使用工具"],
      "correct": 1,
      "explanation": "一个为搜索而优化的研究员 agent、一个为实现而优化的编码 agent、以及一个为代码质量而优化的审查 agent，各自的表现都会优于一个试图同时扮演这三种角色的单一 agent。"
    },
    {
      "stage": "post",
      "question": "什么情况下流水线（顺序）式多 agent 模式优于并行扇出（fan-out）模式？",
      "options": ["当你想把总延迟降到最低时", "当每个阶段都依赖前一阶段的输出时，例如先研究、再编码、再审查", "当所有子任务彼此独立时", "当你拥有的 GPU 数量多于任务数量时"],
      "correct": 1,
      "explanation": "当工作本质上是顺序的时候，流水线模式才合适：编码 agent 需要研究员的输出，审查 agent 又需要编码 agent 的输出。当子任务彼此独立时，并行扇出更好。"
    },
    {
      "stage": "post",
      "question": "在多 agent 系统中，supervisor（监督者）模式是什么？",
      "options": ["由人工手动把任务分配给每个 agent", "一个中心化的编排 agent，负责拆解任务、委派给 worker agent、收集结果并决定下一步", "一个记录 agent 行为以便调试的监控系统", "一种让多个 agent 投票选出最佳回答的模式"],
      "correct": 1,
      "explanation": "supervisor agent 扮演项目经理的角色：它把任务拆成子任务、分配给专精的 worker、审查它们的输出，并决定是继续迭代还是定稿。这为整个工作流提供了中心化的控制。"
    },
    {
      "stage": "post",
      "question": "与单个 agent 相比，多 agent 系统的主要权衡（tradeoff）是什么？",
      "options": ["多 agent 系统产出的结果质量总是更低", "由于多次 LLM 调用和 agent 间通信而带来的复杂度、延迟和成本上升，换取对复杂任务更好的处理能力", "多 agent 系统需要更多的训练数据", "多 agent 系统无法使用外部工具"],
      "correct": 1,
      "explanation": "每多一个 agent 就意味着更多的 LLM 调用（成本）、更多的往返（延迟）以及更多的失败模式（调试复杂度）。只有当任务确实超出了单个 agent 的处理能力时，多 agent 才值得采用。"
    }
  ]
}