Base
基本所有基于深度学习的目标检测器项目的结构都分为:
数据加载器(图像预处理)--> BackBone(骨干,提取目标特征) --> Neck(颈部,收集组合目标特征) --> Head(预测部分) --> 损失函数部分
而算法基于三个元素:输入,输出,以及限制条件。
在图像识别的人工智能任务中,我们无法很好地认识模糊的输入,而输出是很容易理解的。人工智能便是为了处理模糊输入而存在的,并自然地给予准确的输出。为了更好地满足限制条件,我们选择BackBone(提取目标特征) --> Neck(收集组合目标特征) --> Head(预测部分),即算法。这里是难以轻易改动的。
预习
工程级代码的阅读需要以下预设知识:
- 关于面向对象的一切:泛型,单例等