YOLO3输出张量解码过程

理解yolo3输出张量解码过程

  1. Yolo网络输出是一个元组,包含三个张量,代表三个不同尺度,大小是1x255x13x13,1x255x26x26,1x255x52x52。255表示每个格点输出三个预测框,每个预测框包含85个元素,共255个元素。

  2. Yolo3解码过程包括五个阶段:缩小先验框、生成网格、生成预测框、非极大值抑制、显示预测框
    YOLO3输出张量解码过程

  3. 解码过程包含的尺寸变换:
    1 :原图尺寸变换为416x416
    2 :为了在特征图上确定预测框的大小和位置,将先验框缩小(416/13、416/26、416/52)倍
    3 :在特征图上生成网格,根据输出张量,确定预测框的位置和大小;然后将坐标和宽高信息,放大(416/13、416/26、416/52)倍,在原图中显示;最后,将原图恢复至原来的大小

YOLO3输出张量解码过程

上一篇:1.4005马氏体不锈钢X12CrS13机械性能


下一篇:halcon-fast_threshold快速阈值