ai-engineering-from-scratch-zh/phases/02-ml-fundamentals/07-unsupervised-learning/quiz.json at main · fancyboi999/ai-engineering-from-scratch-zh · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
[
  {
    "id": "unsupervised-pre-1",
    "stage": "pre",
    "question": "无监督学习与监督学习的区别是什么？",
    "options": [
      "无监督学习使用更多数据",
      "无监督学习没有带标签的输出——算法自行发现结构",
      "无监督学习只对文本数据有效",
      "无监督学习总是产生更好的结果"
    ],
    "correct": 1,
    "explanation": "在无监督学习中没有标签。算法在不被告知正确输出应该是什么的情况下，发现数据中的模式、分组或结构。"
  },
  {
    "id": "unsupervised-pre-2",
    "stage": "pre",
    "question": "K-Means 要求你在训练前指定什么？",
    "options": [
      "精确的簇中心",
      "簇的数量 K",
      "每个数据点的标签",
      "要使用的距离度量"
    ],
    "correct": 1,
    "explanation": "K-Means 需要簇的数量 K 作为输入。然后它迭代地把点分配到最近的质心并重新计算质心，直到收敛。"
  },
  {
    "id": "unsupervised-post-1",
    "stage": "post",
    "question": "K-Means 在两个相互交错的半月形上失败，而 DBSCAN 成功。为什么？",
    "options": [
      "DBSCAN 比 K-Means 使用更多数据",
      "DBSCAN 基于密度寻找簇，因此能发现任意形状，而 K-Means 假设簇是球形的",
      "DBSCAN 在每个数据集上都优于 K-Means",
      "K-Means 无法处理二维数据"
    ],
    "correct": 1,
    "explanation": "K-Means 把点分配给最近的质心，产生球形（凸）簇。DBSCAN 从稠密区域生长出簇，只要簇在密度上是连通的，就能发现任意形状。"
  },
  {
    "id": "unsupervised-post-2",
    "stage": "post",
    "question": "轮廓系数（silhouette score）衡量的是什么？",
    "options": [
      "找到的簇的总数",
      "每个点相对于最近的其他簇，与自己所在簇的相似程度",
      "聚类算法的速度",
      "数据中异常值的百分比"
    ],
    "correct": 1,
    "explanation": "轮廓系数 = (b - a) / max(a, b)，其中 a 是簇内平均距离，b 是到最近簇的平均距离。它的取值从 -1（分错了簇）到 +1（聚类良好）。"
  },
  {
    "id": "unsupervised-post-3",
    "stage": "post",
    "question": "高斯混合模型在簇分配上与 K-Means 有何不同？",
    "options": [
      "GMM 使用硬分配，每个点恰好属于一个簇",
      "GMM 给出软（概率）分配，每个点对每个簇都有一个归属概率",
      "GMM 完全不使用质心",
      "GMM 只对一维数据有效"
    ],
    "correct": 1,
    "explanation": "K-Means 把每个点恰好分配给一个簇（硬分配）。GMM 计算每个点属于每个高斯成分的概率（软分配），并能建模椭圆形、相互重叠的簇。"
  }
]