原文链接http://www.cnblogs.com/zhouzhendong/p/8798532.html
题目传送门 - BZOJ4259
题意
给你两个串,用其中一个来匹配另一个。问从母串的那些位置开始可以匹配模式串。注意有"*"可以匹配任何字符。
串长$\leq 3\times 10^5$。
题解
本题和BZOJ4503几乎一毛一样。
这里直接放BZOJ4503的传送门。
http://www.cnblogs.com/zhouzhendong/p/8536065.html
但是这题要略微卡一卡时间和空间。
这题让我第一次感受到了寻址的效率之慢。
通过测试,同样是访问大约$8400000$个地址,仅通过改变访问顺序,我可以测出最快访问速度大约13倍的最慢访问速度。就是通过改变访问$8400000$个位置的顺序,使得$460MS\rightarrow 5500MS$(谢谢BZOJ测评器,如果我选紫荆花之恋来测试的话可能得到的数据会更好哈哈,但我不敢)。(但这个应该不是上限)
真的是QAQ。
我写的$FFT$中对$w_{t\times j}$的寻址特别慢,所以导致效率慢了约$3000MS$。写成$Claris$的写法,可以把我的程序卡到$5000MS$(虽然精度会稍微差一点但是可以承受)。
代码
#include <bits/stdc++.h>
#define y1 ______y1
using namespace std;
typedef long long LL;
const int N=1<<20;
const double PI=acos(-1.0);
int n,L,R[N];
struct C{
double r,i;
C(){}
C(double a,double b){r=a,i=b;}
C operator + (C x){return C(r+x.r,i+x.i);}
C operator - (C x){return C(r-x.r,i-x.i);}
C operator * (C x){return C(r*x.r-i*x.i,r*x.i+i*x.r);}
void operator = (double x){r=x,i=0;}
}w[N],x1[N],x2[N],y1[N],y2[N],z[N];
int L1,L2,a[N],b[N];
LL res[N];
char s1[N],s2[N];
void FFT(C a[]){
for (int i=0;i<n;i++)
if (i<R[i])
swap(a[i],a[R[i]]);
for (int t=n>>1,d=1;d<n;d<<=1,t>>=1)
for (int i=0;i<n;i+=(d<<1))
for (int j=0,prod=0;j<d;j++,prod+=t){
C tmp=w[prod]*a[i+j+d];
a[i+j+d]=a[i+j]-tmp;
a[i+j]=a[i+j]+tmp;
}
}
int ans[N],acnt=0;
int main(){
scanf("%d%d%s%s",&L2,&L1,s2,s1);
for (int i=0;i<L2/2;i++)
swap(s2[i],s2[L2-i-1]);
for (int i=0;i<L1;i++)
a[i]=s1[i]=='*'?0:(s1[i]-'a'+1);
for (int i=0;i<L2;i++)
b[i]=s2[i]=='*'?0:(s2[i]-'a'+1);
for (n=1,L=0;n<L1+L2;n<<=1,L++);
for (int i=0;i<n;i++){
R[i]=(R[i>>1]>>1)|((i&1)<<(L-1));
w[i]=C(cos(2*i*PI/n),sin(2*i*PI/n));
}
memset(res,0,sizeof res);
for (int i=0;i<n;i++){
x1[i]=1.0*a[i]*a[i]*a[i],y1[i]=1.0*b[i];
x2[i]=1.0*a[i]*a[i],y2[i]=1.0*b[i]*b[i];
}
FFT(x1),FFT(x2),FFT(y1),FFT(y2);
for (int i=0;i<n;i++){
z[i]=x1[i]*y1[i]-C(2.0,0)*x2[i]*y2[i];
x1[i]=1.0*a[i],y1[i]=1.0*b[i]*b[i]*b[i];
}
FFT(x1),FFT(y1);
for (int i=0;i<n;i++){
z[i]=z[i]+x1[i]*y1[i];
w[i].i*=-1.0;
}
FFT(z);
for (int i=0;i<n;i++)
res[i]=(LL)(z[i].r/n+0.5);
for (int i=L2-1;i<L1;i++)
if (res[i]==0)
ans[++acnt]=i-L2+2;
printf("%d\n",acnt);
for (int i=1;i<=acnt;i++)
printf("%d ",ans[i]);
return 0;
}