1.计算机视觉导论
解决的问题
分类,检测,分割
Single Object
- Classification
- Classification + Localization
Multiple Object
- Object Detection 有些像素里面是目标的,有一些是背景的,所以背景的就是冗余了。
- Segmentation(分割最难),就像是PS的抠图
Semantic Segmentation 语义分割:分割的时候,每个像素进行分类,就是按类分,所以猫与猫之间是没有界限的,同一类物体时被分在一起。
会区分背景,就是会把背景识别出来
Instance Segmentation 实例分割:将不同的物体扣出来,会有不同的个体
背景是不感兴趣区域,所以就不识别出来,不进行处理
图像分割不是目的,只是前提
三个关键
- 硬件的算力
- 样本数据
- 模型的算法
目标检测方法分类
两阶段方法:先从图像上提取候选框,再对每一个候选框进行逐一的甄别,最终把置信度高的候选框,筛选出来,展示出最后的结果。
eg. R-CNN, Fast-RCNN, Faster-RCNN, Mask-RCNN.
缺点:速度比较慢,就像RCNN需要提取2000多个框,那就浪费了很多的算力,但是很准确。
单阶段方法:不需要提取候选框,直接把图像放进去,就可以得到结果,所以速度就非常快。
eg. YOLO、SSD