-
Notifications
You must be signed in to change notification settings - Fork 37
Expand file tree
/
Copy pathquiz.json
More file actions
64 lines (64 loc) · 3.96 KB
/
Copy pathquiz.json
File metadata and controls
64 lines (64 loc) · 3.96 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
{
"questions": [
{
"stage": "pre",
"question": "为什么 U-Net 需要在编码器和解码器之间设置跳跃连接?",
"options": [
"为了加快训练",
"编码器压缩空间细节以获得上下文;如果不能访问编码器的高分辨率特征图,解码器就无法重建清晰的边界,而跳跃连接恰好提供了这些",
"因为转置卷积需要额外的输入",
"为了符合 PyTorch 的形状约定"
],
"correct": 1,
"explanation": "没有跳跃连接时,U-Net 的解码器是从一个极低分辨率的瓶颈产生 H x W 的预测,无法分辨清晰的边缘。跳跃连接把编码器的高分辨率、低语义特征拼接进解码器的低分辨率、高语义特征,使每个输出阶段都同时拥有上下文和细节。"
},
{
"stage": "pre",
"question": "一个分割任务有 99% 的背景像素和 1% 的肿瘤像素。你用普通交叉熵训练并达到 99% 的像素准确率。发生了什么?",
"options": [
"模型收敛了",
"模型学会了对每个像素都预测背景;像素准确率被多数类主导,忽略了你真正关心的那个类别",
"损失函数实现错了",
"优化器失败了"
],
"correct": 1,
"explanation": "在不平衡数据集上像素准确率是一个无用的指标。网络通过总是预测背景就拿到容易的 99%,却产生空的肿瘤掩码。修复办法:把交叉熵与 Dice 损失(基于重叠、与尺度无关)结合,并按每个前景类别报告 IoU/Dice。"
},
{
"stage": "post",
"question": "哪种任务类型能把同一类别的各辆汽车彼此分开?",
"options": [
"语义分割",
"实例分割",
"两者产生相同的输出",
"两者都不行——那需要改用检测模型"
],
"correct": 1,
"explanation": "语义分割给每个像素标注一个类别,但会把同一类别相接触的实例合并成一团。实例分割保留实例 ID,因此每辆车、每个人、每个苹果都是一个单独的预测掩码。全景分割统一了两者:对 stuff 给语义标签,对 things 给实例 ID。"
},
{
"stage": "post",
"question": "你把 U-Net 的双线性上采样 + 3x3 卷积换成 kernel_size=2、stride=2 的 ConvTranspose2d,结果在输出中看到棋盘格伪影。为什么?",
"options": [
"PyTorch 中的转置卷积有 bug",
"当 kernel_size 不能被 stride 整除时,输出像素从输入像素得到的贡献不均等,从而在输出中产生看起来像棋盘格的周期性图案",
"学习率太低",
"必须在转置卷积之前加入批归一化"
],
"correct": 1,
"explanation": "棋盘格伪影来自转置卷积感受野在各输出位置上的不均匀重叠。使用 kernel_size = stride * n(例如核 4、步长 2),或用双线性上采样 + 卷积取代转置卷积,可以消除这些伪影。正因如此,现代的默认做法是双线性 + 卷积。"
},
{
"stage": "post",
"question": "你在一个 10 类分割任务上报告 mIoU = 0.78。为什么你还应该公布每个类别的 IoU?",
"options": [
"PyTorch 要求提供每个类别的 IoU",
"平均 IoU 掩盖了单个类别的失败;mIoU 为 0.78 也可能对应八个类别为 0.9、两个类别为 0.3,这与所有类别都接近 0.78 是完全不同的部署情形",
"每个类别的 IoU 总是高于 mIoU",
"它只在医学影像中才需要"
],
"correct": 1,
"explanation": "聚合均值压缩了各类别分数的分布,而这恰恰是读者判断模型是否可上线所需要的信息。一个总体很强的模型中有两个薄弱类别,可能使系统在目标任务上无法使用;分布平坦则意味着模型需要一次统一的数据升级。务必在均值之外同时公布每个类别的指标。"
}
]
}