ai-engineering-from-scratch-zh/phases/04-computer-vision/07-semantic-segmentation-unet/quiz.json at main · fancyboi999/ai-engineering-from-scratch-zh · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
{
  "questions": [
    {
      "stage": "pre",
      "question": "为什么 U-Net 需要在编码器和解码器之间设置跳跃连接？",
      "options": [
        "为了加快训练",
        "编码器压缩空间细节以获得上下文；如果不能访问编码器的高分辨率特征图，解码器就无法重建清晰的边界，而跳跃连接恰好提供了这些",
        "因为转置卷积需要额外的输入",
        "为了符合 PyTorch 的形状约定"
      ],
      "correct": 1,
      "explanation": "没有跳跃连接时，U-Net 的解码器是从一个极低分辨率的瓶颈产生 H x W 的预测，无法分辨清晰的边缘。跳跃连接把编码器的高分辨率、低语义特征拼接进解码器的低分辨率、高语义特征，使每个输出阶段都同时拥有上下文和细节。"
    },
    {
      "stage": "pre",
      "question": "一个分割任务有 99% 的背景像素和 1% 的肿瘤像素。你用普通交叉熵训练并达到 99% 的像素准确率。发生了什么？",
      "options": [
        "模型收敛了",
        "模型学会了对每个像素都预测背景；像素准确率被多数类主导，忽略了你真正关心的那个类别",
        "损失函数实现错了",
        "优化器失败了"
      ],
      "correct": 1,
      "explanation": "在不平衡数据集上像素准确率是一个无用的指标。网络通过总是预测背景就拿到容易的 99%，却产生空的肿瘤掩码。修复办法：把交叉熵与 Dice 损失（基于重叠、与尺度无关）结合，并按每个前景类别报告 IoU/Dice。"
    },
    {
      "stage": "post",
      "question": "哪种任务类型能把同一类别的各辆汽车彼此分开？",
      "options": [
        "语义分割",
        "实例分割",
        "两者产生相同的输出",
        "两者都不行——那需要改用检测模型"
      ],
      "correct": 1,
      "explanation": "语义分割给每个像素标注一个类别，但会把同一类别相接触的实例合并成一团。实例分割保留实例 ID，因此每辆车、每个人、每个苹果都是一个单独的预测掩码。全景分割统一了两者：对 stuff 给语义标签，对 things 给实例 ID。"
    },
    {
      "stage": "post",
      "question": "你把 U-Net 的双线性上采样 + 3x3 卷积换成 kernel_size=2、stride=2 的 ConvTranspose2d，结果在输出中看到棋盘格伪影。为什么？",
      "options": [
        "PyTorch 中的转置卷积有 bug",
        "当 kernel_size 不能被 stride 整除时，输出像素从输入像素得到的贡献不均等，从而在输出中产生看起来像棋盘格的周期性图案",
        "学习率太低",
        "必须在转置卷积之前加入批归一化"
      ],
      "correct": 1,
      "explanation": "棋盘格伪影来自转置卷积感受野在各输出位置上的不均匀重叠。使用 kernel_size = stride * n（例如核 4、步长 2），或用双线性上采样 + 卷积取代转置卷积，可以消除这些伪影。正因如此，现代的默认做法是双线性 + 卷积。"
    },
    {
      "stage": "post",
      "question": "你在一个 10 类分割任务上报告 mIoU = 0.78。为什么你还应该公布每个类别的 IoU？",
      "options": [
        "PyTorch 要求提供每个类别的 IoU",
        "平均 IoU 掩盖了单个类别的失败；mIoU 为 0.78 也可能对应八个类别为 0.9、两个类别为 0.3，这与所有类别都接近 0.78 是完全不同的部署情形",
        "每个类别的 IoU 总是高于 mIoU",
        "它只在医学影像中才需要"
      ],
      "correct": 1,
      "explanation": "聚合均值压缩了各类别分数的分布，而这恰恰是读者判断模型是否可上线所需要的信息。一个总体很强的模型中有两个薄弱类别，可能使系统在目标任务上无法使用；分布平坦则意味着模型需要一次统一的数据升级。务必在均值之外同时公布每个类别的指标。"
    }
  ]
}