本博文參考http://blog.csdn.net/v_july_v/article/details/7041827
关于其它字符串匹配算法见http://blog.csdn.net/WINCOL/article/details/4795369
暴力匹配算法
暴力匹配的思路。如果如今文本串S匹配到 i 位置,模式串P匹配到 j 位置。则有:
- 假设当前字符匹配成功(即S[i] == P[j])。则i++,j++。继续匹配下一个字符;
- 假设失配(即S[i]! = P[j]),令i = i - (j - 1),j = 0。相当于每次匹配失败时,i 回溯,j 被置为0。
KMP算法概述
KMP算法过程
- 假设当前字符匹配成功(即S[i] == P[j])。则i++。j++。继续匹配下一个字符。
- 假设失配(即S[i]! = P[j]),令i = i - (j - 1)。j = 0。相当于每次匹配失败时,j回溯到next[j]
goodbye了。
如此一来。每一个当前位置的移动位数都与
基本工作已经完毕了一
= k。
比方下图中C和C相等,所以next[j+1]=2+1=3;
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
pj-1 pj匹配,
next[k] ]跟pj还是不匹配。则须要寻找长度更短的同样前缀后缀,即下一步用p[
next[ next[k] ] ]去跟pj匹配。
此过程相当于模式串的自我匹配,所以不断的递归k
= next[k],直到要么找到长度更短的同样前缀后缀。要么没有长度更短的同样前缀后缀。例如以下图所看到的:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
void GetNext(char* p,int next[])
{
int pLen = strlen(p);
next[0] = -1;
int k = -1;
int j = 0;
while (j < pLen - 1){
//p[k]表示前缀,p[j]表示后缀
if (k == -1 || p[j] == p[k]){
++k;
++j;
next[j] = k;
}
else k = next[k];
}
}
当然。此时的KMP算法还是基础版。还有优化版见:
http://baike.baidu.com/link?url=7TyIFAuf53azP6XofEc5oWivGEp5Gt9Dxnmhy5USg7eyiZzEBWiBVLjle1ZpSBUMU-Zqgeh9qqPiQwRdN4lqEq中的优化部分。