计算机视觉/图像处理

2024-04-02 21:58:17

图像处理输入是图像，输出是图像，常见的任务包括：降噪，超分辨，去模糊，去马赛克，去雾去雨去栅栏去云等等的去X系列，再对焦，图像补全，压缩感知，计算成像（MRI, CT, Light field, ...），等等，外加一些图像增强的任务，比如锐化之类的。

而计算机视觉输入是图像，输出是知识。常见的任务：各种识别（人脸，猫，狗，交通灯，疾病，异常，造假....），图像转文字（image captioning，etc），图像转语音，转特征值，目标定位，追踪，等等

第一个重境界：图像识别：猫狗分类、人脸识别、植物病变

第二重境界：物体检测：R - CNN，这个网络不仅可以告诉你分类，还可以告诉你目标物体的坐标；YOLO算法，无人驾驶

第三重境界：图像切割：U型网络，轮廓

第四重境界：聚类：推荐，以图搜图，淘宝推荐服装

第五层境界：降噪，auto-encoder；GAN

第六重境界：图像风格迁移，GAN，CycleGAN

第七重境界：GAN

码农公寓