文章目录
一、准备
pytorch文档:https://pytorch.org/docs/stable/index.html
YOLOv3论文精讲:https://www.bilibili.com/video/BV1Vg411V7bJ
YOLOv3的pytorch复现-学习视频:https://www.bilibili.com/video/BV1Hp4y1y788
YOLOv3的pytorch复现-学习博客:https://blog.csdn.net/weixin_44791964/article/details/105310627
YOLOv3的pytorch复现-学习代码:https://github.com/bubbliiiing/yolo3-pytorch
二、核心点
Darknet53的骨干网络、特征金字塔、
概述:
网络输入图片为416*416*3
,输出三个尺寸的数据结构,分别是52*52*3*(4+1+20)、26*26*3*(4+1+20)和13*13*3*(4+1+20)
,其中前面的S*S表示有多少个grid cell,3表示每个grid cell对应的3个anchor,每个anchor有5个参数分别是anchor中心的x、y,anchor的宽和高还有anchor的置信度,20表示VOC数据集20个类别的条件类别概率。
骨干网络Darknet53负责进行特征提取。
特征金字塔就是这三个尺寸的数据结构生成过程,骨干网络最后三层的feature map 经过卷积和上采样与上一层feature map堆叠