Codeforces 666E Forensic Examination 广义后缀自动机+线段树合并

Codeforces 666E Forensic Examination

题意

给出一个字符串\(s\),\(m\)个字符串\(t_1,t_2,\dots,t_m\),\(q\)次询问,每次询问给出四个整数\(l,r,pl,pr\),问\(t_l,t_{l+1},\dots,t_r\)中哪个字符串中\(s[pl;pr]\)作为子串出现次数最多,输出该\(t_i\)的下标和\(s[pl;pr]\)的出现次数。

\(|s| \le 5\cdot 10^5,m\le 5 \cdot 10^4,\sum|t_i| \le 5 \cdot 10^4,1\le l \le r \le m,1\le pl \le pr \le |s|\)

分析

把所有\(t_i\)后加一个字符'#',然后连起来变成\(t_1\#t_2\#\dots t_n\)建后缀自动机,对自动机上每个状态建线段树,\(cnt[v][i]\)表示状态\(v\)的结束位置属于字符串\(t_i\)的个数,线段树维护区间最大值。

把询问离线,然后用字符串\(s\)直接在自动机上跑,对\(s\)的每个前缀\([1;i]\)在自动机上找到能匹配上的最长后缀所在的状态\(v\),遍历所有询问中\(pr=i\)的,按\(pl\)升序遍历,对于每个询问让\(v\)跳后缀链接,跳到一个\(longest(v)\)刚好大于等于\(i-pl+1\)的状态,然后在这个状态的线段树上区间查询\([l,r]\)的最大值即可。

Code

#include<bits/stdc++.h>
#define rep(i,x,n) for(int i=x;i<=n;i++)
#define per(i,n,x) for(int i=n;i>=x;i--)
#define sz(a) int(a.size())
#define rson mid+1,r,rs[p]
#define pii pair<int,int>
#define lson l,mid,ls[p]
#define ll long long
#define pb push_back
#define mp make_pair
#define se second
#define fi first
using namespace std;
const double eps=1e-8;
const int mod=1e9+7;
const int N=1e6+10;
const int M=2e5+10;
const int inf=1e9;
int n,m,q;
char s[N],t[N];
vector<int>g[N];
struct ppo{
	int l,r,x,id;
	bool operator <(const ppo &o)const{
		return x<o.x;
	}
};
vector<ppo>p[N];
pii ans[N];
pii cmax(pii a,pii b){
	if(a.se==b.se){
		if(a.fi<b.fi) return a;
		return b;
	}
	if(a.se>b.se) return a;
	return b;
}
struct SegmentTree{
    pii tr[M*40];
    int ls[M*40],rs[M*40],tot;
    void up(int x,int l,int r,int &p){
        if(!p) p=++tot;
        if(l==r){
        	tr[p].se++;
        	tr[p].fi=l;
        	return;
        }
        int mid=l+r>>1;
        if(x<=mid) up(x,lson);
        else up(x,rson);
        tr[p]=cmax(tr[ls[p]],tr[rs[p]]);
    }
    int merge(int x,int y,int l,int r){
        if(!x||!y) return x+y;
        int p=++tot,mid=l+r>>1;
        if(l==r){
        	tr[p]=mp(l,tr[x].se+tr[y].se);
        }else{
            ls[p]=merge(ls[x],ls[y],l,mid);
            rs[p]=merge(rs[x],rs[y],mid+1,r);
            tr[p]=cmax(tr[ls[p]],tr[rs[p]]);
        }
        return p;
    }
    pii qy(int dl,int dr,int l,int r,int p){
        if(!p||l>r) return mp(dl,0);
        if(l==dl&&r==dr) return tr[p];
        int mid=l+r>>1;
        if(dr<=mid) return qy(dl,dr,lson);
        else if(dl>mid) return qy(dl,dr,rson);
        else return cmax(qy(dl,mid,lson),qy(mid+1,dr,rson));
    }
}seg;
struct SAM{
    int last,cnt;int ch[M][27],fa[M],len[M],rt[M];
    void insert(int c,int pos){
        int p=last,np=++cnt;last=np;len[np]=len[p]+1;
        for(;p&&!ch[p][c];p=fa[p]) ch[p][c]=np;
        if(!p) fa[np]=1;
        else {
            int q=ch[p][c];
            if(len[q]==len[p]+1) fa[np]=q;
            else  {
                int nq=++cnt;len[nq]=len[p]+1;
                memcpy(ch[nq],ch[q],sizeof ch[q]);
                fa[nq]=fa[q],fa[q]=fa[np]=nq;
                for(;ch[p][c]==q;p=fa[p]) ch[p][c]=nq;
            }
        }
        seg.up(pos,1,m,rt[np]);
    }
    void init(){
        last=cnt=1;
    }
    void dfs(int u){
        for(int x:g[u]){
            dfs(x);
            rt[u]=seg.merge(rt[u],rt[x],1,m);
        }
    }
    void gao(){
        for(int i=2;i<=cnt;i++) g[fa[i]].pb(i);
        dfs(1);
    }
    void solve(){
    	int u=1,l=0;
        for(int i=1;i<=n;i++){
        	while(!ch[u][s[i]-'a']&&u!=1) u=fa[u],l=len[u];
        	if(!ch[u][s[i]-'a']){
        		for(ppo it:p[i]){
        			ans[it.id]=mp(it.l,0);
        		}
        		continue;
        	}
        	u=ch[u][s[i]-'a'];l++;
        	int v=u,dl=l;
        	for(ppo it:p[i]){
        		if(dl<i-it.x+1){
        			ans[it.id]=mp(it.l,0);
        			continue;
        		}
        		while(len[fa[v]]>=i-it.x+1) v=fa[v],dl=len[v];
        		ans[it.id]=seg.qy(it.l,it.r,1,m,rt[v]);
        	}
        }
    }
}sam;
int main(){
    scanf("%s",s+1);
    n=strlen(s+1);
    sam.init();
    scanf("%d",&m);
    for(int i=1;i<=m;i++){
    	scanf("%s",t);
    	int l=strlen(t);
    	for(int j=0;j<l;j++) sam.insert(t[j]-'a',i);
    	if(i!=m) sam.insert(26,i);
    }
    sam.gao();
    scanf("%d",&q);
    for(int i=1,l,r,pl,pr;i<=q;i++){
    	scanf("%d%d%d%d",&l,&r,&pl,&pr);
    	p[pr].pb(ppo{l,r,pl,i});
    }
    for(int i=1;i<=n;i++) sort(p[i].begin(), p[i].end());
    sam.solve();
	for(int i=1;i<=q;i++) printf("%d %d\n",ans[i].fi,ans[i].se);
    return 0;
}
上一篇:DataSource接口


下一篇:SyntaxError异常