翻译自 https://cs231n.github.io/classification/
L1/L2 distances, hyperparameter search(超参搜索), cross-validation(交叉验证)
Image Classification 图像分类
很多不同的视觉问题如物体检测, 目标分割最后都可以被化简为图像分类问题.
举例
类似如下的输入图像, 计算机都会将其作为一个很大的三维数组进行处理, 比如下图宽248,长400, 有三个颜色通道(RGB), 那么该图像实际由 248 x 400 x 3 个数字组成.
每个数字都在[0(black),255(white)]范围之间.
我们的任务就是通过这些数字, 得到这张图片所属的分类是 cat
难点
由上可知,我们输入的图片在电脑处理中实际是表示明暗的数组,因此可能会遇到如下问题:
视角不同 (Viewpoint variation).
尺度不同 (Scale variation).
变形 (Deformation).
被遮挡 (Occlusion.).
受照明条件的影响 (Illumination conditions).
背景影响 (Background clutter).
同类物体的差异 (Intra-class variation).