-
Notifications
You must be signed in to change notification settings - Fork 37
Expand file tree
/
Copy pathquiz.json
More file actions
64 lines (64 loc) · 3.19 KB
/
Copy pathquiz.json
File metadata and controls
64 lines (64 loc) · 3.19 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
{
"questions": [
{
"stage": "pre",
"question": "余弦相似度衡量两个向量之间的什么?",
"options": [
"它们之间的欧氏距离",
"它们之间的夹角,忽略各自的模长",
"它们逐元素乘积之和",
"任一单个维度上的最大差值"
],
"correct": 1,
"explanation": "余弦相似度衡量两个向量夹角的余弦值,并按各自模长归一化。它的取值从 -1(反向)到 +1(同向),并忽略向量长度,这就是为什么它在文档长度属于噪声的 NLP 中占主导地位。"
},
{
"stage": "pre",
"question": "为什么 L1 距离被称为“曼哈顿距离”?",
"options": [
"它是在曼哈顿发明的",
"它沿着网格测量距离,就像在城市街区中行走一样",
"它只在恰好二维的情况下有效",
"它计算所有维度上的最大差值"
],
"correct": 1,
"explanation": "L1 距离把每个轴上的绝对差值相加,这对应于只能沿坐标轴移动(不能走对角线)的网格上的最短路径——就像在城市街道网格上行走。"
},
{
"stage": "post",
"question": "为什么 L1 正则化(Lasso)会产生稀疏权重,而 L2 正则化(Ridge)不会?",
"options": [
"L1 使用比 L2 更大的惩罚常数",
"L1 的菱形约束在坐标轴上有顶点,那里权重为零;损失等高线很可能在顶点处相切",
"L2 正则化只作用于偏置项",
"L1 正则化把低于阈值的权重裁剪为零"
],
"correct": 1,
"explanation": "L1 的约束区域是一个顶点与坐标轴对齐的菱形。损失函数的等高线椭圆最有可能首先在菱形的某个顶点处相切,而在那里一个或多个权重恰好为零。L2 的约束是一个没有顶点的圆,因此相切点处所有权重都非零。"
},
{
"stage": "post",
"question": "在比较概率分布时,Wasserstein 距离相比 KL 散度有什么优势?",
"options": [
"Wasserstein 总是小于 KL 散度",
"即使分布不重叠,Wasserstein 也能提供有意义的梯度,而 KL 会趋于无穷",
"Wasserstein 是对称的,而 KL 不是",
"B 和 C 都正确"
],
"correct": 3,
"explanation": "Wasserstein 距离是一个真正的度量(对称、满足三角不等式),即使对不重叠的分布也能提供梯度。KL 散度是非对称的,且当分布不重叠时会趋于无穷,这就是 WGAN 取代基于 KL 的 GAN 的原因。"
},
{
"stage": "post",
"question": "什么时候应该使用马氏距离而非欧氏距离?",
"options": [
"当特征都是二值(0 或 1)时",
"当特征具有不同的量纲且彼此相关时",
"当你比较的是字符串而非向量时",
"当你需要比 L2 更快的计算时"
],
"correct": 1,
"explanation": "马氏距离考虑了数据的协方差结构,在计算 L2 距离之前先对特征去相关并归一化。它能正确处理不同量纲且相关的特征,而欧氏距离对所有维度一视同仁。"
}
]
}