给定一个模式串 S,以及一个模板串 P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模板串 P 在模式串 S 中多次作为子串出现。
求出模板串 P 在模式串 S 中所有出现的位置的起始下标。
输入格式
第一行输入整数 N,表示字符串 P 的长度。
第二行输入字符串 P。
第三行输入整数 M,表示字符串 S 的长度。
第四行输入字符串 S。
输出格式
共一行,输出所有出现位置的起始下标(下标从 0 开始计数),整数之间用空格隔开。
数据范围
1≤N≤105
1≤M≤106
输入样例:
3
aba
5
ababa
输出样例:
0 2
对于以下样例
KMP的难点主要在于模式串的移动,这里我们直接计算next数组,从图可以看到
S[i]!=P[j+1],那么我们将最长公共前缀移动到最长公共后缀的位置
此时j应该等于next[j],对于A,此时最长公共前后缀等于2,那么就是将模式串的 [1,next[ j ] ] 位移动到 [j-next[ j ] , j ], 就是前缀移动到后缀,所以 j=next[j] 就可以把后缀所在位置变成前缀所在位置,即把前缀挪到后缀。此时这部分是已经匹配的。循环上述过程即可完成匹配。
next的数组求解本质上是与自己进行匹配。
代码:(这里next数组从0开始)
#include <iostream>
using namespace std;
const int N = 100010, M = 1000010;
int n, m;
int ne[N];
char s[M], p[N];
int main()
{
cin >> n >> p + 1 >> m >> s + 1;
for (int i = 2, j = 0; i <= n; i ++ )
{
while (j && p[i] != p[j + 1]) j = ne[j];
if (p[i] == p[j + 1]) j ++ ;
ne[i] = j;
cout<<ne[i]<<endl;
}
for (int i = 1, j = 0; i <= m; i ++ )
{
while (j && s[i] != p[j + 1]) j = ne[j];//移动到后缀
//printf("%d\n",j);
if (s[i] == p[j + 1]) j ++ ;
if (j == n)
{
printf("%d ", i - n);
j = ne[j];
}
}
return 0;
}