SURF分析算法
一个、整体形象
这个概念是积分图像Viola和Jones建议。随机位积分图像(i。j)的值原始图象的左上角随机点(i,j)级配相应的重点领域值的总和,其数学公式如图1所看到的:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvQ1hQMjIwNTQ1NTI1Ng==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvQ1hQMjIwNTQ1NTI1Ng==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
那么,当我们想要计算图片一个区域的积分,就仅仅需计算这个区域的四个顶点在积分图像里的值,便能够通过2步加法和2步减法计算得出。其数学公式例如以下:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvQ1hQMjIwNTQ1NTI1Ng==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
二、Hession矩阵探測器
1、斑点检測
斑点:与周围有着颜色和灰度区别的区域。
在一个一维信号中,让它和高斯二阶导数进行卷积。也就是拉普拉斯变换,那么在信号的边缘处就会出现过零点。例如以下图所看到的:
高斯拉普拉斯Log探測器的响应值就是在衡量图像的相似性。例如以下图是一个图像的高斯拉普拉斯变换的三维图和灰度图显示。在图像中的斑点尺寸与高斯拉普拉斯函数
的形状趋于一致时,图像的拉普拉斯响应抵达最大。
Hession矩阵就是利用二阶微分来进行斑点检測,其矩阵例如以下:
2、Hession矩阵与盒子滤波器
在图像中的Hession矩阵例如以下:
他们的三维图和灰度图例如以下所看到的:
由此。我们把模板(图像中的区域)与图像的卷积运算转化为盒子滤波器的运算,例如以下图所看到的:
3、hession矩阵行列式的简化
当我们用sigma = 1.2.的高斯二阶微分滤波,模板尺寸为9X9最为最小的尺度空间值对图像进行滤波和斑点检測,Hession矩阵的行列式可做例如以下简化:
常数C不影响极值点的比較,所以终于简化式例如以下,这也是SURF论文里面Hession响应值计算公式的来源:
另外,响应值还要依据滤波器大小进行归一化处理。以保证随意大小滤波器的F范数是统一的。
0.9^2是滤波器响应的相关权重w是为了平衡Hessian行列式的表示式。这是为了保持高斯核与近似高斯核的一致性。
理论上来说对于不同的σ的值和相应尺寸的模板尺寸。w值是不同的,但为了简化起见,能够觉得它是同一个常数。 使用近似的Hessian矩阵行列式来表示图像中某一点x处的斑点响应值。遍历图像中全部的像元点,便形成了在某一尺度下琉璃点检測的响应图像。使用不同的模板尺寸,
便形成了多尺度斑点响应的金字塔图像,利用这一金字塔图像,就能够进行斑点响应极值点的搜索。
三、3D非极大值抑制
1、尺度金字塔构造
在SURF中。採用不断增大盒子滤波器模板尺寸与积分图像求取Hession矩阵响应。然后在响应图像上採用3D非极大值抑制。求取各种不同尺度
的斑点,下面是两种不同的金字塔,SURF的金字塔属于另外一种:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvQ1hQMjIwNTQ1NTI1Ng==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
SURF中採用9X9尺寸的滤波器作为起始滤波器。之后的滤波器尺寸可由下面公式计算得出:
octave、interval在公式中都是从1開始。也就是当第0组第0层时,在公式中octave = 1, interval = 1。
採用这样的方式来定义滤波器尺寸的理由例如以下;
滤波器响应长度、滤波器尺寸、组索引O、层索引S
尺度sigma之间的关系例如以下:
採用类似的方法来处理其它几组的模板序列。其方法是将滤波器尺寸添加量翻倍(6,12。24。38)。这样。能够得到第二组的滤波器尺寸。它们分别为15。27,39,51。第三组的滤波器尺寸为27,51。75,99。假设原始图像的尺寸仍然大于相应的滤波器尺寸,尺度空间的分析还能够进行第四组,其相应的模板尺寸分别为51。99,147,195。下图显示了第一组至第三组的滤波器尺寸变化:
在通常尺度分析情况下,随着尺度的增大。被检測到的斑点数量迅速衰减。所以一般进行3-4组就能够了。与此同一时候,为了降低运算量。提高计算的速度,能够考虑在滤波时,将採样间隔设为2。
2、为了在图像及不同尺寸中定位兴趣点,我们用了3×3×3邻域非最大值抑制:
全部小于预设极值的取值都被丢弃,添加极值使检測到的特征点数量降低。终于仅仅有几个特征最强点会被检測出来。
检測过程中使用与该尺度层图像解析度相相应大小的滤波器进行检測,以3×3的滤波器为例,该尺度层图像中9个像素点之中的一个图2检測特征点与自身尺度层中其余8个点和在其之上及之下的两个尺度层9个点进行比較,共26个点。图中标记‘x’的像素点的特征值若大于周围像素则可确定该点为该区域的特征点。
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvQ1hQMjIwNTQ1NTI1Ng==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
3、局部极大值精确定位
採用3维线性插值法得到亚像素级的特征点。同一时候也去掉那些值小于一定阈值的点。
四、特征点描写叙述符
1、特征点方向分配
以特征点为中心。计算半径为6s(S为特征点所在的尺度值)的邻域内的点在x、y方向的Haar小波(Haar小波边长取4s)响应,Harr小波
模板如图所看到的:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvQ1hQMjIwNTQ1NTI1Ng==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
计算出图像在哈尔小波的x和y方向上的响应值之后,对两个值进行因子为2S的高斯加权。加权后的值分别表示在水平和垂直方向上的方向分量。
Harr特征值反应了图像灰度变化的情况,那么这个主方向就是描写叙述那些灰度变化特别剧烈的区域方向。
接着,以特征点为中心。张角为π/3的扇形滑动。计算窗体内的Harr小波响应值dx、dy的累加:
扇形窗体的滑动如图所看到的:
在OpenSURF的C++代码实现例如以下:
for(int i = -6; i <= 6; ++i)
{
for(int j = -6; j <= 6; ++j)
{
if(i*i + j*j < 36)
{
gauss = static_cast<float>(gauss25[id[i+6]][id[j+6]]);
resX[idx] = gauss * haarX(r+j*s, c+i*s, 4*s);
resY[idx] = gauss * haarY(r+j*s, c+i*s, 4*s);
Ang[idx] = getAngle(resX[idx], resY[idx]);
++idx;
}
}
}
通过i,j来控制以特征点为中心的6X6的范围,(i*i + j*j < 36)则筛选落在以特征点为中心。半径为6s的圆形区域内的点,然后计算HaarX与HarrY并与通过事先计算好的Gauss
滤波。并计算出每一个点的角度。
最后将最大值那个扇形的方向作为该特征点的主方向。
在OpenSURF寻找扇形中具有最大值得方向代码例如以下:
for(ang1 = 0; ang1 < 2*pi; ang1+=0.15f) {
ang2 = ( ang1+pi/3.0f > 2*pi ? ang1-5.0f*pi/3.0f : ang1+pi/3.0f);
sumX = sumY = 0.f;
for(unsigned int k = 0; k < Ang.size(); ++k)
{
// get angle from the x-axis of the sample point
const float & ang = Ang[k]; // determine whether the point is within the window
if (ang1 < ang2 && ang1 < ang && ang < ang2)
{
sumX+=resX[k];
sumY+=resY[k];
}
else if (ang2 < ang1 &&
((ang > 0 && ang < ang2) || (ang > ang1 && ang < 2*pi) ))
{
sumX+=resX[k];
sumY+=resY[k];
}
} // if the vector produced from this window is longer than all
// previous vectors then this forms the new dominant direction
if (sumX*sumX + sumY*sumY > max)
{
// store largest orientation
max = sumX*sumX + sumY*sumY;
orientation = getAngle(sumX, sumY);
}
}
2、特征点特征矢量的生成
以特征点为中心,沿主方向将20SX20S的图像划分为4X4个子块,每一个子块用尺寸2S的Harr模板进行响应值计算,并统计每一个子块中
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvQ1hQMjIwNTQ1NTI1Ng==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
这样就有4X4X4=64维的特征数据。例如以下图所看到的:
在计算这个矩形区域时并非先把它旋转到主方向。而是先计算出每个点的Harr响应值dx、dy并高斯加权处理后。把dx、dy进行旋转变换,计算
公式例如以下:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvQ1hQMjIwNTQ1NTI1Ng==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
在OpenSURF的实现源代码中採用的是第二种方式,通过点旋转公式。把点旋转到主方向上并进行近期邻插值的相应点,公式例如以下:
五、匹配
为了加速匹配过程。SURF借助Laplacian(在之前计算Hessian是能够顺便得出,不占用太多的时间)的符号使匹配过程索引加快。这样能够将以下的情况区分开,然后在进行描写叙述符匹配:
參考资料:
http://www.cnblogs.com/ronny/p/4045979.html
http://doc.okbase.net/ronny/archive/107771.html
http://www.tuicool.com/articles/2i6fqq3
http://wenku.baidu.com/view/cf0c164f2e3f5727a5e96238.html
版权声明:本文博客原创文章,博客,未经同意,不得转载。