-
Notifications
You must be signed in to change notification settings - Fork 36
Expand file tree
/
Copy pathquiz.json
More file actions
90 lines (90 loc) · 3.13 KB
/
Copy pathquiz.json
File metadata and controls
90 lines (90 loc) · 3.13 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
{
"lesson": "24-agent-observability-platforms",
"title": "Agent 可观测性:Langfuse、Phoenix、Opik",
"questions": [
{
"stage": "pre",
"question": "在 2025 年 6 月把原先的商业模块开源后,Langfuse 以什么许可证发布?",
"options": [
"GPLv3",
"MIT",
"Elastic License 2.0",
"Apache 2.0"
],
"correct": 1,
"explanation": "2025 年 6 月后,Langfuse 是 MIT,包括 LLM-as-a-judge、标注队列、prompt 实验和 Playground。"
},
{
"stage": "pre",
"question": "按本课所说,Arize Phoenix 最擅长什么?",
"options": [
"prompt 版本管理",
"深度的、agent 专属的评估:trace 聚类、异常检测、RAG 检索相关性、OpenInference 自动 instrumentation",
"自动化优化循环",
"代码的静态分析"
],
"correct": 1,
"explanation": "Phoenix 专注于行为漂移和 RAG 评估,配 OpenInference 自动 instrumentation。"
},
{
"stage": "check",
"question": "哪个平台把自动 prompt 优化与护栏(PII 脱敏、话题约束)以及 LLM 评判的幻觉检测配在一起?",
"options": [
"Langfuse",
"Phoenix",
"Opik",
"Jaeger"
],
"correct": 2,
"explanation": "Opik 以「优化 + 护栏」循环为核心。"
},
{
"stage": "check",
"question": "本课为带 prompt 管理的一体化推荐哪个平台?",
"options": [
"Langfuse",
"Phoenix",
"Opik",
"Datadog APM"
],
"correct": 0,
"explanation": "Langfuse 端到端覆盖 tracing + prompt 管理 + 评估 + 会话回放。"
},
{
"stage": "check",
"question": "本课对厂商发布的平台基准怎么说?",
"options": [
"它们是权威的",
"把它们当作方向性参考;用你自己的语料来衡量",
"它们被 OpenTelemetry 禁止",
"只有 Opik 的可靠"
],
"correct": 1,
"explanation": "即便是引用的 Opik 与 Langfuse 之间 14 倍的差距,决定前也应在你自己的数据上衡量。"
},
{
"stage": "post",
"question": "为什么有 tracing 而无评估被视为昂贵的日志记录?",
"options": [
"磁盘比 CPU 贵",
"你能看到运行但不给它们打分,因此回归不可见、二分定位不可能",
"提供商对 span 收费",
"span 无法被重放"
],
"correct": 1,
"explanation": "评估才是把 trace 转化为可付诸行动的质量信号的东西。"
},
{
"stage": "post",
"question": "本课关于自建 LLM 评判者的警告是什么?",
"options": [
"它们被 Apache 2.0 禁止",
"CRITIC 适用:评判者需要外部接地来做事实核实,否则就会盖橡皮图章",
"它们只在 TypeScript 中有效",
"它们必须在 GPU 上运行"
],
"correct": 1,
"explanation": "没有基于外部工具的核实,LLM 评判者会漂向盖橡皮图章(CRITIC,第 5 课)。"
}
]
}