ai-engineering-from-scratch-zh/phases/01-math-foundations/14-norms-and-distances/quiz.json at main · fancyboi999/ai-engineering-from-scratch-zh · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
{
  "questions": [
    {
      "stage": "pre",
      "question": "余弦相似度衡量两个向量之间的什么？",
      "options": [
        "它们之间的欧氏距离",
        "它们之间的夹角，忽略各自的模长",
        "它们逐元素乘积之和",
        "任一单个维度上的最大差值"
      ],
      "correct": 1,
      "explanation": "余弦相似度衡量两个向量夹角的余弦值，并按各自模长归一化。它的取值从 -1（反向）到 +1（同向），并忽略向量长度，这就是为什么它在文档长度属于噪声的 NLP 中占主导地位。"
    },
    {
      "stage": "pre",
      "question": "为什么 L1 距离被称为“曼哈顿距离”？",
      "options": [
        "它是在曼哈顿发明的",
        "它沿着网格测量距离，就像在城市街区中行走一样",
        "它只在恰好二维的情况下有效",
        "它计算所有维度上的最大差值"
      ],
      "correct": 1,
      "explanation": "L1 距离把每个轴上的绝对差值相加，这对应于只能沿坐标轴移动（不能走对角线）的网格上的最短路径——就像在城市街道网格上行走。"
    },
    {
      "stage": "post",
      "question": "为什么 L1 正则化（Lasso）会产生稀疏权重，而 L2 正则化（Ridge）不会？",
      "options": [
        "L1 使用比 L2 更大的惩罚常数",
        "L1 的菱形约束在坐标轴上有顶点，那里权重为零；损失等高线很可能在顶点处相切",
        "L2 正则化只作用于偏置项",
        "L1 正则化把低于阈值的权重裁剪为零"
      ],
      "correct": 1,
      "explanation": "L1 的约束区域是一个顶点与坐标轴对齐的菱形。损失函数的等高线椭圆最有可能首先在菱形的某个顶点处相切，而在那里一个或多个权重恰好为零。L2 的约束是一个没有顶点的圆，因此相切点处所有权重都非零。"
    },
    {
      "stage": "post",
      "question": "在比较概率分布时，Wasserstein 距离相比 KL 散度有什么优势？",
      "options": [
        "Wasserstein 总是小于 KL 散度",
        "即使分布不重叠，Wasserstein 也能提供有意义的梯度，而 KL 会趋于无穷",
        "Wasserstein 是对称的，而 KL 不是",
        "B 和 C 都正确"
      ],
      "correct": 3,
      "explanation": "Wasserstein 距离是一个真正的度量（对称、满足三角不等式），即使对不重叠的分布也能提供梯度。KL 散度是非对称的，且当分布不重叠时会趋于无穷，这就是 WGAN 取代基于 KL 的 GAN 的原因。"
    },
    {
      "stage": "post",
      "question": "什么时候应该使用马氏距离而非欧氏距离？",
      "options": [
        "当特征都是二值（0 或 1）时",
        "当特征具有不同的量纲且彼此相关时",
        "当你比较的是字符串而非向量时",
        "当你需要比 L2 更快的计算时"
      ],
      "correct": 1,
      "explanation": "马氏距离考虑了数据的协方差结构，在计算 L2 距离之前先对特征去相关并归一化。它能正确处理不同量纲且相关的特征，而欧氏距离对所有维度一视同仁。"
    }
  ]
}