目标检测常见模型
难点在于输出层目标的个数不是确定的。如果讲图片切分成不同的小的部分,目标则可能会出现在不同的区域中,计算上吃不消。以下算法可以解决这一问题
R-CNN(Regions with CNN features)
- 通过selective research将图像分为2000左右个region proposals;
- 将所有的region proposals作为CNN的输入,输出区域特征;
- 将区域特征输入SVM分类器进行分类。
问题:
- 计算量还是很大;
- 不能实时计算;
- region proposal生成算法是固定的,可能效果不是很好。
Fast R-CNN
直接对整个图片进行卷积、池化等操作,而不是将其分为若干个region proposals作为输入。是可以用作实时目标检测的。
YOLO
他讲的不是很详细,没看懂。但是知道它很快