2012 年,AlexNet 在 ImageNet 图像识别比赛中夺冠,将图像分类的错误率降低了一半,从此一战成名。十年来,计算机视觉领域蓬勃发展,深度学习技术突破让机器在很多视觉任务上超越了人类。
计算机视觉也是目前应用最多、落地最广的人工智能技术。即使是外行,也能随便举出很多技术落地的应用:刷脸支付、美颜相机,还有工业领域的产品缺陷检测,以及交通管理中的车辆识别等。与此同时,也有一些计算机视觉技术应用引发了争议和担忧,比如人脸识别的隐私问题、换脸假视频。
计算机视觉的终极目标是什么?未来 5 年计算机视觉的研究重点将是什么?伴随着「深度学习进入瓶颈期」论调的出现,2021 年,入行计算机视觉还有「前途」吗?这些都是大家关注的问题。
简单的回顾的话,2006年Geoffrey Hinton的论文点燃了“这把火”,现在已经有不少人开始泼“冷水”了,主要是AI泡沫太大,而且深度学习不是包治百病的药方。
计算机视觉不是深度学习最早看到突破的领域,真正让大家大吃一惊的颠覆传统方法的应用领域是语音识别,做出来的公司是微软,而不是当时如日中天的谷歌。计算机视觉应用深度学习堪称突破的成功点是2012年ImageNet比赛,采用的模型是CNN,而不是Hinton搞的RBM和DBN之类,就是Hinton学生做出来以他命名的AlexNet。