bzoj3277 串 (后缀数组+二分答案+ST表)

常见操作:先把所有串都连到一起,但中间加上一个特殊的符号(不能在原串中/出现过)作为分割

由于全部的子串就等于所有后缀的所有前缀,那我们对于每一个后缀,去求一个最长的前缀,来满足这个前缀在至少K个原串中出现过

那我们就二分一下这个前缀的长度。现在的问题就是怎么判断这个前缀是否在K个串中出现过了。

显然,对于一个后缀s的长度为x的前缀,只要某个后缀t 和s的LCP>=x,就说明x也是t的后缀

我们知道,LCP(x,y)=min{height[rank[y]],height[rank[y]-1],...,height[rank[x]+1]},所以其实t和s的LCP也是单调的,满足条件的是一个排名区间

那我们用二分出来这个区间的左右端点(用st表预处理一下height的区间最小值),然后只要判断这个区间里的后缀是否满足出现在K个串中就可以了

我们只要提前处理出来left[i],表示一个最大的排名,使得sa[left[i]]...sa[i]在不同串中出现次数>=K,然后判断我刚二分出来的那个区间[l,r],是否l<=left[r]就可以了

复杂度$O(nlog^2n)$,据说有点卡常,那稍微优化一下

我们第一次二分前缀的长度的时候,显然现在在做的的最大的长度一定是>=(上一个后缀的最大前缀长度-1)的,所以只要像求height那样推着做就可以了

据说均摊复杂度O(nlogn)

(第一次写后缀数组各种懵...最后还是全都照着大佬的题解抄的...)

 #include<bits/stdc++.h>
#define pa pair<int,int>
#define ll long long
using namespace std;
const int maxn=2e5+; inline ll rd(){
ll x=;char c=getchar();int neg=;
while(c<''||c>''){if(c=='-') neg=-;c=getchar();}
while(c>=''&&c<='') x=x*+c-'',c=getchar();
return x*neg;
} int NN,N,M,K;
char ch[maxn];
int suf[maxn],rank[maxn],rank1[maxn],cnt[maxn],tmp[maxn];
int h[maxn],left0[maxn],bel[maxn],st[maxn][],pos[maxn][]; inline void getsuf(){
int i,j,k;M=;
for(i=;i<=N;i++) cnt[ch[i]]=;
for(i=;i<=M;i++) cnt[i]+=cnt[i-];
for(i=N;i;i--) rank[i]=cnt[ch[i]];
for(k=;j!=N;k<<=){
memset(cnt,,sizeof(cnt));
for(i=;i<=N;i++) cnt[rank[i+k>N?:i+k]]++;
for(i=;i<=M;i++) cnt[i]+=cnt[i-];
for(i=N;i;i--) tmp[cnt[rank[i+k>N?:i+k]]--]=i;
memset(cnt,,sizeof(cnt));
for(i=;i<=N;i++) cnt[rank[i]]++;
for(i=;i<=M;i++) cnt[i]+=cnt[i-];
for(i=N;i;i--) suf[cnt[rank[tmp[i]]]--]=tmp[i];
memcpy(rank1,rank,sizeof(rank));
rank[suf[]]=j=;
for(i=;i<=N;i++){
int ipk=suf[i]+k>N?:suf[i]+k,i1pk=suf[i-]+k>N?:suf[i-]+k;
if(rank1[ipk]!=rank1[i1pk]||rank1[suf[i]]!=rank1[suf[i-]]) j++;
rank[suf[i]]=j;
}M=j;
}
for(i=;i<=N;i++) suf[rank[i]]=i;
} inline void geth(){
//h[1]=1;
for(int i=,j=;i<=N;i++){
if(rank[i]==) continue;
if(j) j--;
int x=suf[rank[i]-];
while(i+j<=N&&x+j<=N&&ch[i+j]==ch[x+j]) j++;
h[rank[i]]=j;
}
} inline void getleft0(){
int n=;
memset(cnt,,sizeof(cnt));
for(int i=,j=;i<=N;i++){
if(ch[suf[i]]=='z'+) continue;
if(!cnt[bel[suf[i]]]) n++;
cnt[bel[suf[i]]]++;
if(n>=K){
for(;n-(cnt[bel[suf[j]]]==)>=K;n-=(cnt[bel[suf[j++]]]==)) cnt[bel[suf[j]]]--;
left0[i]=j;
}
}
} inline void getst(){
for(int i=N;i;i--){
st[i][]=h[i];
for(int j=;st[i+(<<(j-))][j-];j++){
st[i][j]=min(st[i][j-],st[i+(<<(j-))][j-]);
}
}
} inline int rmq(int l,int r){
int k=log2(r-l+);
return min(st[l][k],st[r-(<<k)+][k]);
} inline bool check(int p,int x){
int l,r,l0,r0;
if(h[p+]<x) r0=p;
else{
l=p+;r=N;
while(l<=r){
int m=(l+r)>>;
if(rmq(p+,m)>=x)r0=m,l=m+;
else r=m-;
}
}
if(h[p]<x) l0=p;
else{
l=;r=p;
while(l<=r){
// printf("%d %d\n",l,r);
int m=(l+r)>>;
if(rmq(m,p)>=x) l0=m,r=m-;
else l=m+;
}l0--;
}
return left0[r0]>=l0;
} inline void solve(){
for(int i=;i<=NN;i++){
int k=;ll ans=;
for(int j=pos[i][];j<pos[i][];j++){
if(k) k--;
for(;j+k<pos[i][]&&check(rank[j],k+);k++);
ans=ans+k;
}
printf("%lld ",ans);
}printf("\n");
} int main(){
//freopen("3277.in","r",stdin);
// freopen("aa.out","w",stdout);
int i,j,k;
N=NN=rd(),K=rd();
for(i=,j=;i<=N;i++){
pos[i][]=j;
scanf("%s",ch+j);k=strlen(ch+j);
ch[j+k]='z'+;
for(int t=j;t<j+k;t++) bel[t]=i;
j=j+k+;
pos[i][]=j-;
}N=j-;
getsuf();
geth();
getleft0();
getst();
solve();
return ;
}
上一篇:第二课 android项目结构


下一篇:读DataSnap源代码(四)