深度学习七

我看到过的最复杂的模型就是SSD了,应该说在object detection这个领域,大牛们都是一再的奋斗着、努力着。一路飘过,听到的模型真的有很多,但是我觉得有质的变化还应该是R-CNN—SPP—fast rcnn —faster rcnn— yolo,为什么会是这样呢,我感觉其实如果是但一物体的识别就应该是regression的问题,rbg大神也许也这么想,所以自然多物体的检测就不是单纯的regression,但是我还想让识别如分类那般,简单,自然。那怎么办呢?就诞生了R-CNN,不再是regression可能的枚举,用了selective search的方法去匹配寻找特征,提取出classifier,然后再用bbox回归,使其达到最优。正如作者所言,科学需要不断地反复实验和对比才显得有价值。SPP主要解决了输入图片尺寸的问题,更加显得更有艺术一些;最后fast和faster摒弃了SVM分类器的方法,前面还是不够艺术,说是simple,其实是分步做了这些工作,所以Fast就出现了,最后大神自己都说速度被限制在了第一步,ROI上,于是出现了Faster Rcnn,最后yolo,直接强制划分7*7,变成回归来做,也不需要那些繁琐的步骤。其实我也有过这种想法,但是不知道怎么做。

自从看了他们的文章,老师也说地道,不得不说,不仅地道,分析问题一针见血,用词相当精辟,像我是想不出来的。。。我还记得FAST R-CNN里有这么一句原话:Solutions to these problems often compromise speed,accuracy,or simplicity.当然我比较喜欢compromise。

说了这么多,其实我就想说,网络的定义,你看看上面这么多的case,网络都是哪样的,上次那个RCNN最经典,一个卷积接着一个池化,最后再通过全连接层。然后你再看看fast rcnn,faster rcnn和SSD,模型的结构越来越复杂。

上一篇:《神经网络论文精读》


下一篇:leetcode 快乐数