图像处理输入是图像,输出是图像,常见的任务包括:降噪,超分辨,去模糊,去马赛克,去雾去雨去栅栏去云等等的去X系列,再对焦,图像补全,压缩感知,计算成像(MRI, CT, Light field, ...),等等,外加一些图像增强的任务,比如锐化之类的。
而计算机视觉输入是图像,输出是知识。常见的任务:各种识别(人脸,猫,狗,交通灯,疾病,异常,造假....),图像转文字(image captioning,etc),图像转语音,转特征值,目标定位,追踪,等等
第一个重境界: 图像识别:猫狗分类、人脸识别、植物病变
第二重境界 : 物体检测:R - CNN,这个网络不仅可以告诉你分类,还可以告诉你目标物体的坐标;YOLO算法,无人驾驶
第三重境界 : 图像切割:U型网络,轮廓
第四重境界:聚类:推荐,以图搜图,淘宝推荐服装
第五层境界 :降噪,auto-encoder;GAN
第六重境界 : 图像风格迁移,GAN,CycleGAN
第七重境界:GAN