|
YOLOv2的输入输出是什么?
输入:
图像尺寸:默认输入为 416×416 像素 的 RGB 图像(支持多尺度训练,如 320×320、608×608 等)。
预处理:图像需归一化(像素值缩放到 [0, 1] 或标准化为均值为 0、方差为 1)。
特点:输入尺寸为 32 的倍数(如 416 = 13×32),以确保下采样后特征图的尺寸为整数。
输出:
(S, S, B×(5 + C))的网格
S×S 的网格(默认 S=13,即 13×13 的网格)
B 个边界框,默认5
5是位置+置信度
C为类别的概率 |
|