-
Notifications
You must be signed in to change notification settings - Fork 37
Expand file tree
/
Copy pathquiz.json
More file actions
64 lines (64 loc) · 2.88 KB
/
Copy pathquiz.json
File metadata and controls
64 lines (64 loc) · 2.88 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
{
"questions": [
{
"stage": "pre",
"question": "在贝叶斯定理中,“先验(prior)”是什么?",
"options": [
"证据的概率",
"在观察到任何证据之前你对某个假设的信念",
"在假设成立的条件下证据的概率",
"看到证据后最终更新的概率"
],
"correct": 1,
"explanation": "先验 P(A) 代表在看到任何数据之前你对假设 A 的初始信念。在观察到证据 B 之后,它会被更新为后验 P(A|B)。"
},
{
"stage": "pre",
"question": "某种罕见疾病每 1 万人中有 1 人患病。一项准确率 99% 的检测返回阳性。你患该病的概率大约是多少?",
"options": [
"99%",
"约 1%",
"50%",
"10%"
],
"correct": 1,
"explanation": "尽管检测准确率为 99%,但该病极为罕见(0.01%),以至于大多数阳性结果都来自健康人群(假阳性)。贝叶斯定理给出 P(患病|阳性) 约为 0.98%,而不是 99%。"
},
{
"stage": "post",
"question": "朴素贝叶斯分类器中的拉普拉斯平滑是什么,为什么它是必要的?",
"options": [
"它把特征值归一化为零均值、单位方差",
"它为每个特征加上一个小计数,以防止未见过的词带来零概率,否则整个乘积都会变成零",
"它平滑类别之间的决策边界",
"它降低特征空间的维度"
],
"correct": 1,
"explanation": "没有平滑时,一个在垃圾邮件训练数据中从未出现过的词会得到 P(词|垃圾邮件)=0,使整个乘积变为零,无论其他强烈的垃圾邮件特征如何。给每个计数加 1 可以防止这种情况。"
},
{
"stage": "post",
"question": "最大后验估计(MAP)与最大似然估计(MLE)有何不同?",
"options": [
"MAP 使用比 MLE 更大的数据集",
"MAP 引入了参数的先验分布,等价于加入正则化,而 MLE 只使用似然",
"MAP 比 MLE 计算更快",
"MLE 总是比 MAP 产生更好的结果"
],
"correct": 1,
"explanation": "MAP 最大化 P(数据|参数) * P(参数),而 MLE 只最大化 P(数据|参数)。先验 P(参数) 起到正则化的作用——高斯先验相当于 L2 正则化,拉普拉斯先验相当于 L1。"
},
{
"stage": "post",
"question": "在序贯贝叶斯更新中,你从 Beta(1,1) 开始,观察到 7 次正面和 3 次反面。后验是什么?",
"options": [
"Beta(7, 3)",
"Beta(8, 4)",
"Beta(1.7, 1.3)",
"Normal(0.7, 0.1)"
],
"correct": 1,
"explanation": "Beta-二项共轭更新把成功次数加到第一个参数上、失败次数加到第二个参数上:Beta(1+7, 1+3) = Beta(8, 4)。后验均值为 8/12 = 0.667。"
}
]
}