bzoj 3796: Mushroom追妹纸【二分+后缀数组+st表】

把三个串加上ASCII大于z的分隔符连起来,然后求SA

显然每个相同子串都是一个后缀的前缀,所以枚举s1的每个后缀的最长和s2相同的前缀串(直接在排序后的数组里挨个找,最近的两个分别属于s1和s2的后缀的height一定是最长符合要求的前缀),然后判断一下这个子串里最早出现的和s3相同的子串的位置,这里先预处理出每个等于s3的子串的位置然后二分找(没有就直接和height取max),然后答案就是从这个后缀开头到和s3相同子串结尾的前一个位置的长度

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=200005;
int l1,l2,l3,n,wa[N],wb[N],wv[N],wsu[N],sa[N],rk[N],he[N],b[N],st[20][N],ans,bl[N],a[N],tot;
char s[N],c1[N],c2[N];
bool cmp(int r[],int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
void saa(char r[],int n,int m)
{
int *x=wa,*y=wb;
for(int i=0;i<=m;i++)
wsu[i]=0;
for(int i=1;i<=n;i++)
wsu[x[i]=r[i]]++;
for(int i=1;i<=m;i++)
wsu[i]+=wsu[i-1];
for(int i=n;i>=1;i--)
sa[wsu[x[i]]--]=i;
for(int j=1,p=1;j<=n&&p<n;j<<=1,m=p)
{
p=0;
for(int i=n-j+1;i<=n;i++)
y[++p]=i;
for(int i=1;i<=n;i++)
if(sa[i]>j)
y[++p]=sa[i]-j;
for(int i=1;i<=n;i++)
wv[i]=x[y[i]];
for(int i=0;i<=m;i++)
wsu[i]=0;
for(int i=1;i<=n;i++)
wsu[wv[i]]++;
for(int i=1;i<=m;i++)
wsu[i]+=wsu[i-1];
for(int i=n;i>=1;i--)
sa[wsu[wv[i]]--]=y[i];
swap(x,y);
p=1;
x[sa[1]]=1;
for(int i=2;i<=n;i++)
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p:++p;
}
for(int i=1;i<=n;i++)
rk[sa[i]]=i;
for(int i=1,j,k=0;i<=n;he[rk[i++]]=k)
for(k?k--:0,j=sa[rk[i]-1];r[i+k]==r[j+k];k++);
}
int ques(int l,int r)
{
l++;
int k=b[r-l+1];
return min(st[k][l],st[k][r-(1<<k)+1]);
}
int ef(int x)
{
int l=1,r=tot,ans=0;
while(l<=r)
{
int mid=(l+r)>>1;
if(a[mid]>=x)
r=mid-1,ans=mid;
else
l=mid+1;
}
return ans;
}
int main()
{
scanf("%s%s%s",s+1,c1+1,c2+1);
n=l1=strlen(s+1),l2=strlen(c1+1),l3=strlen(c2+1);
s[++n]='z'+1;
for(int i=1;i<=l2;i++)
s[++n]=c1[i];
s[++n]='z'+2;
for(int i=1;i<=l3;i++)
s[++n]=c2[i];
// for(int i=1;i<=n;i++)
// cerr<<s[i];cerr<<endl;
saa(s,n,200);
// for(int i=1;i<=n;i++)
// cerr<<sa[i]<<" "<<he[i]<<endl;cerr<<endl;
b[0]=-1;
for(int i=1;i<=n;i++)
st[0][i]=he[i],b[i]=b[i>>1]+1;
for(int i=1;i<=17;i++)
for(int j=1;j+(1<<i)-1<=n;j++)
st[i][j]=min(st[i-1][j],st[i-1][j+(1<<(i-1))]);
for(int i=1;i<=n;i++)
{
if(sa[i]<=l1)
bl[i]=1;
else if(sa[i]>l1+1&&sa[i]<=l1+1+l2)
bl[i]=2;
else if(sa[i]>l1+l2+2)
bl[i]=3;
}
a[++tot]=l1+l2+3;
for(int i=rk[l1+l2+3]+1;i<=n;i++)
{
if(he[i]>=l3)
a[++tot]=sa[i];
else
break;
}
for(int i=rk[l1+l2+3]-1;i>=1;i--)
{
if(he[i+1]>=l3)
a[++tot]=sa[i];
else
break;
}
sort(a+1,a+1+tot);
// for(int i=1;i<=tot;i++)
// cerr<<a[i]<<" ";cerr<<endl;
int la;
for(la=1;la<=n;la++)
if(bl[la]==1||bl[la]==2)
break;
for(int i=la+1;i<=n;i++)
if(bl[i]==1||bl[i]==2)
{
if(bl[i]!=bl[la])
{
int p=ef(sa[i]),len=ques(la,i);
if(p&&a[p]+l3-1<=sa[i]+len-1)
ans=max(ans,a[p]-sa[i]+l3-1);//,cerr<<sa[i]<<" "<<sa[i-1]<<" "<<len<<" "<<a[p]<<" "<<a[p]-sa[i]+l3-1<<endl;
else
ans=max(ans,len);
}
la=i;
}
printf("%d\n",ans);
return 0;
}
上一篇:【bzoj3796】Mushroom追妹纸 hash/sa+kmp+二分


下一篇:局域网Internet的共享