理解yolo3输出张量解码过程
-
Yolo网络输出是一个元组,包含三个张量,代表三个不同尺度,大小是1x255x13x13,1x255x26x26,1x255x52x52。255表示每个格点输出三个预测框,每个预测框包含85个元素,共255个元素。
-
Yolo3解码过程包括五个阶段:缩小先验框、生成网格、生成预测框、非极大值抑制、显示预测框
-
解码过程包含的尺寸变换:
1 :原图尺寸变换为416x416
2 :为了在特征图上确定预测框的大小和位置,将先验框缩小(416/13、416/26、416/52)倍
3 :在特征图上生成网格,根据输出张量,确定预测框的位置和大小;然后将坐标和宽高信息,放大(416/13、416/26、416/52)倍,在原图中显示;最后,将原图恢复至原来的大小