L1/L2 distances, hyperparameter search, cross-validation

翻译自 https://cs231n.github.io/classification/

L1/L2 distances, hyperparameter search(超参搜索), cross-validation(交叉验证)

Image Classification 图像分类

很多不同的视觉问题如物体检测, 目标分割最后都可以被化简为图像分类问题.

举例

类似如下的输入图像, 计算机都会将其作为一个很大的三维数组进行处理, 比如下图宽248,长400, 有三个颜色通道(RGB), 那么该图像实际由 248 x 400 x 3 个数字组成.

每个数字都在[0(black),255(white)]范围之间.

我们的任务就是通过这些数字, 得到这张图片所属的分类是 cat
L1/L2 distances, hyperparameter search, cross-validation

难点

由上可知,我们输入的图片在电脑处理中实际是表示明暗的数组,因此可能会遇到如下问题:

视角不同 (Viewpoint variation).
尺度不同 (Scale variation).
变形 (Deformation).
被遮挡 (Occlusion.).
受照明条件的影响 (Illumination conditions).
背景影响 (Background clutter).
同类物体的差异 (Intra-class variation).
L1/L2 distances, hyperparameter search, cross-validation

上一篇:Selenium自动化 - 显式等待中的EC模块元素判断详解


下一篇:Linux 共享内存