-
Notifications
You must be signed in to change notification settings - Fork 37
Expand file tree
/
Copy pathquiz.json
More file actions
39 lines (39 loc) · 3.42 KB
/
Copy pathquiz.json
File metadata and controls
39 lines (39 loc) · 3.42 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
{
"questions": [
{
"stage": "pre",
"question": "什么是「单 agent 天花板」?",
"options": ["单个 agent 能使用的工具数量上限", "当任务超出单个上下文窗口、需要不同领域的专长、或需要并行作业时,单个 agent 就会失效的临界点", "单个 agent 每分钟能发起的 API 调用次数上限", "能在单块 GPU 上运行的最大模型尺寸"],
"correct": 1,
"explanation": "单个 agent 只有一个上下文窗口、一个系统提示,并且是顺序处理的。当任务需要读取 50 个文件(上下文溢出)、在研究与编码之间来回切换(混合专长)、或同时进行多项独立工作(并行)时,单个 agent 就会崩溃。"
},
{
"stage": "pre",
"question": "为什么要用多个专精的 agent,而不是一个强大的通用 agent?",
"options": ["多个 agent 总是比单个大模型更便宜", "每个 agent 都可以拥有聚焦的系统提示、更小的上下文以及专用工具,从而在各自的子任务上表现更好", "多个 agent 可以共享同一个上下文窗口", "通用 agent 无法使用工具"],
"correct": 1,
"explanation": "一个为搜索而优化的研究员 agent、一个为实现而优化的编码 agent、以及一个为代码质量而优化的审查 agent,各自的表现都会优于一个试图同时扮演这三种角色的单一 agent。"
},
{
"stage": "post",
"question": "什么情况下流水线(顺序)式多 agent 模式优于并行扇出(fan-out)模式?",
"options": ["当你想把总延迟降到最低时", "当每个阶段都依赖前一阶段的输出时,例如先研究、再编码、再审查", "当所有子任务彼此独立时", "当你拥有的 GPU 数量多于任务数量时"],
"correct": 1,
"explanation": "当工作本质上是顺序的时候,流水线模式才合适:编码 agent 需要研究员的输出,审查 agent 又需要编码 agent 的输出。当子任务彼此独立时,并行扇出更好。"
},
{
"stage": "post",
"question": "在多 agent 系统中,supervisor(监督者)模式是什么?",
"options": ["由人工手动把任务分配给每个 agent", "一个中心化的编排 agent,负责拆解任务、委派给 worker agent、收集结果并决定下一步", "一个记录 agent 行为以便调试的监控系统", "一种让多个 agent 投票选出最佳回答的模式"],
"correct": 1,
"explanation": "supervisor agent 扮演项目经理的角色:它把任务拆成子任务、分配给专精的 worker、审查它们的输出,并决定是继续迭代还是定稿。这为整个工作流提供了中心化的控制。"
},
{
"stage": "post",
"question": "与单个 agent 相比,多 agent 系统的主要权衡(tradeoff)是什么?",
"options": ["多 agent 系统产出的结果质量总是更低", "由于多次 LLM 调用和 agent 间通信而带来的复杂度、延迟和成本上升,换取对复杂任务更好的处理能力", "多 agent 系统需要更多的训练数据", "多 agent 系统无法使用外部工具"],
"correct": 1,
"explanation": "每多一个 agent 就意味着更多的 LLM 调用(成本)、更多的往返(延迟)以及更多的失败模式(调试复杂度)。只有当任务确实超出了单个 agent 的处理能力时,多 agent 才值得采用。"
}
]
}