论文信息
- 题目:Histograms of Oriented Gradients for Human Detection
- 作者:Navneet Dalal and Bill Triggs
- 刊物:Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’05)
- DOI:10.1109/CVPR.2005.177
论文整体理解
这篇文章是一篇典型的介绍实验成果的论文,该论文提出了著名的梯度方向直方图(Histogram of Oriented Gradient, HOG)方法,直到今天这一方法仍然被广泛使用。文章的布局较为清晰,先是从整体上介绍了研究结果并回顾了前人的工作,然后介绍了研究方法和整体思路,接着详细介绍了研究内容及成果,最后进行总结并对未来的工作进行了展望。
HOG方法的基本思想是:局部物体的外观和形状通常可以被梯度或边缘方向的分布很好地描述。HOG特征提取的主要过程:把样本图像分割为若干个单元(cell),把梯度方向平均划分为多个区间(bin),在每个单元里以梯度幅值为权重对所有像素的梯度方向在各个方向区间进行直方图统计,得到一个多维的特征向量。再将多个单元组合起来构成块(block)(块之间可以重叠),以块为单位对单元进行归一化,把一个块内所有单元的特征向量连起来得到维数更多的特征向量作为块的特征向量。用块对检测窗口进行扫描,将所有块的特征向量连起来得到最终的描述符。
详细解读
这篇文章的解读是我一门课程的大作业,详细解读见链接1的pdf,懒得再排版成博客了,pdf中还包含了一段简单的HOG实现代码(基于Python)。
(说明:由于这篇文章的重点在于 HOG 方法的实现,因此对于前两部分内容我没有重点解读。在理解 HOG 方法的实现步骤时我参考了网络上的一些文章并结合原文增加了一些原文中没有的图、公式及文字说明)
英文原文见链接2
链接1: 详细解读及示例代码.
链接2: 英文原文.