YOLOv5 网络架构

2024-01-06 11:51:46

Base

基本所有基于深度学习的目标检测器项目的结构都分为：
数据加载器（图像预处理）--> BackBone(骨干，提取目标特征) --> Neck（颈部，收集组合目标特征） --> Head（预测部分） --> 损失函数部分

而算法基于三个元素：输入，输出，以及限制条件。

在图像识别的人工智能任务中，我们无法很好地认识模糊的输入，而输出是很容易理解的。人工智能便是为了处理模糊输入而存在的，并自然地给予准确的输出。为了更好地满足限制条件，我们选择BackBone(提取目标特征) --> Neck（收集组合目标特征） --> Head（预测部分），即算法。这里是难以轻易改动的。

预习

工程级代码的阅读需要以下预设知识：

关于面向对象的一切：泛型，单例等

图像预处理

YOLOv5 网络架构

码农公寓

Base

预习

图像预处理

相关文章