-
Notifications
You must be signed in to change notification settings - Fork 37
Expand file tree
/
Copy pathquiz.json
More file actions
67 lines (67 loc) · 2.75 KB
/
Copy pathquiz.json
File metadata and controls
67 lines (67 loc) · 2.75 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
[
{
"id": "unsupervised-pre-1",
"stage": "pre",
"question": "无监督学习与监督学习的区别是什么?",
"options": [
"无监督学习使用更多数据",
"无监督学习没有带标签的输出——算法自行发现结构",
"无监督学习只对文本数据有效",
"无监督学习总是产生更好的结果"
],
"correct": 1,
"explanation": "在无监督学习中没有标签。算法在不被告知正确输出应该是什么的情况下,发现数据中的模式、分组或结构。"
},
{
"id": "unsupervised-pre-2",
"stage": "pre",
"question": "K-Means 要求你在训练前指定什么?",
"options": [
"精确的簇中心",
"簇的数量 K",
"每个数据点的标签",
"要使用的距离度量"
],
"correct": 1,
"explanation": "K-Means 需要簇的数量 K 作为输入。然后它迭代地把点分配到最近的质心并重新计算质心,直到收敛。"
},
{
"id": "unsupervised-post-1",
"stage": "post",
"question": "K-Means 在两个相互交错的半月形上失败,而 DBSCAN 成功。为什么?",
"options": [
"DBSCAN 比 K-Means 使用更多数据",
"DBSCAN 基于密度寻找簇,因此能发现任意形状,而 K-Means 假设簇是球形的",
"DBSCAN 在每个数据集上都优于 K-Means",
"K-Means 无法处理二维数据"
],
"correct": 1,
"explanation": "K-Means 把点分配给最近的质心,产生球形(凸)簇。DBSCAN 从稠密区域生长出簇,只要簇在密度上是连通的,就能发现任意形状。"
},
{
"id": "unsupervised-post-2",
"stage": "post",
"question": "轮廓系数(silhouette score)衡量的是什么?",
"options": [
"找到的簇的总数",
"每个点相对于最近的其他簇,与自己所在簇的相似程度",
"聚类算法的速度",
"数据中异常值的百分比"
],
"correct": 1,
"explanation": "轮廓系数 = (b - a) / max(a, b),其中 a 是簇内平均距离,b 是到最近簇的平均距离。它的取值从 -1(分错了簇)到 +1(聚类良好)。"
},
{
"id": "unsupervised-post-3",
"stage": "post",
"question": "高斯混合模型在簇分配上与 K-Means 有何不同?",
"options": [
"GMM 使用硬分配,每个点恰好属于一个簇",
"GMM 给出软(概率)分配,每个点对每个簇都有一个归属概率",
"GMM 完全不使用质心",
"GMM 只对一维数据有效"
],
"correct": 1,
"explanation": "K-Means 把每个点恰好分配给一个簇(硬分配)。GMM 计算每个点属于每个高斯成分的概率(软分配),并能建模椭圆形、相互重叠的簇。"
}
]