Time Limit: 30 Sec Memory Limit: 512 MB
Description
如果一个字符串可以被拆分为 AABBAABB 的形式,其中 AA 和 BB 是任意非空字符串,则我们称该字符串的这种拆分是优秀的。例如,对于字符串 aabaabaa,如果令 A=aabA=aab,B=aB=a,我们就找到了这个字符串拆分成 AABBAABB 的一种方式。一个字符串可能没有优秀的拆分,也可能存在不止一种优秀的拆分。比如我们令 A=aA=a,B=baaB=baa,也可以用 AABBAABB 表示出上述字符串;但是,字符串 abaabaa 就没有优秀的拆分。现在给出一个长度为 nn 的字符串 SS,我们需要求出,在它所有子串的所有拆分方式中,优秀拆分的总个数。这里的子串是指字符串中连续的一段。以下事项需要注意:出现在不同位置的相同子串,我们认为是不同的子串,它们的优秀拆分均会被记入答案。在一个拆分中,允许出现 A=BA=B。例如 cccc 存在拆分 A=B=cA=B=c。字符串本身也是它的一个子串。
Input
每个输入文件包含多组数据。输入文件的第一行只有一个整数 TT,表示数据的组数。保证 1≤T≤101≤T≤10。接下来 TT 行,每行包含一个仅由英文小写字母构成的字符串 SS,意义如题所述。
Output
输出 TT 行,每行包含一个整数,表示字符串 SS 所有子串的所有拆分中,总共有多少个是优秀的拆分。
Sample Input
4
aabbbb
cccccc
aabaabaabaa
bbaabaababaaba
aabbbb
cccccc
aabaabaabaa
bbaabaababaaba
Sample Output
3
5
4
7
我们用 S[i,j]S[i,j] 表示字符串 SS 第 ii 个字符到第 jj 个字符的子串(从 11 开始计数)。第一组数据中,共有 33 个子串存在优秀的拆分:S[1,4]=aabbS[1,4]=aabb,优秀的拆分为 A=aA=a,B=bB=b;S[3,6]=bbbbS[3,6]=bbbb,优秀的拆分为 A=bA=b,B=bB=b;S[1,6]=aabbbbS[1,6]=aabbbb,优秀的拆分为 A=aA=a,B=bbB=bb。而剩下的子串不存在优秀的拆分,所以第一组数据的答案是 33。第二组数据中,有两类,总共 44 个子串存在优秀的拆分:对于子串 S[1,4]=S[2,5]=S[3,6]=ccccS[1,4]=S[2,5]=S[3,6]=cccc,它们优秀的拆分相同,均为 A=cA=c,B=cB=c,但由于这些子串位置不同,因此要计算 33 次;对于子串 S[1,6]=ccccccS[1,6]=cccccc,它优秀的拆分有 22 种:A=cA=c,B=ccB=cc 和 A=ccA=cc,B=cB=c,它们是相同子串的不同拆分,也都要计入答案。所以第二组数据的答案是 3+2=53+2=5。第三组数据中,S[1,8]S[1,8] 和 S[4,11]S[4,11] 各有 22 种优秀的拆分,其中 S[1,8]S[1,8] 是问题描述中的例子,所以答案是 2+2=42+2=4。第四组数据中,S[1,4]S[1,4],S[6,11]S[6,11],S[7,12]S[7,12],S[2,11]S[2,11],S[1,8]S[1,8] 各有 11 种优秀的拆分,S[3,14]S[3,14] 有 22 种优秀的拆分,所以答案是 5+2=75+2=7。
5
4
7
我们用 S[i,j]S[i,j] 表示字符串 SS 第 ii 个字符到第 jj 个字符的子串(从 11 开始计数)。第一组数据中,共有 33 个子串存在优秀的拆分:S[1,4]=aabbS[1,4]=aabb,优秀的拆分为 A=aA=a,B=bB=b;S[3,6]=bbbbS[3,6]=bbbb,优秀的拆分为 A=bA=b,B=bB=b;S[1,6]=aabbbbS[1,6]=aabbbb,优秀的拆分为 A=aA=a,B=bbB=bb。而剩下的子串不存在优秀的拆分,所以第一组数据的答案是 33。第二组数据中,有两类,总共 44 个子串存在优秀的拆分:对于子串 S[1,4]=S[2,5]=S[3,6]=ccccS[1,4]=S[2,5]=S[3,6]=cccc,它们优秀的拆分相同,均为 A=cA=c,B=cB=c,但由于这些子串位置不同,因此要计算 33 次;对于子串 S[1,6]=ccccccS[1,6]=cccccc,它优秀的拆分有 22 种:A=cA=c,B=ccB=cc 和 A=ccA=cc,B=cB=c,它们是相同子串的不同拆分,也都要计入答案。所以第二组数据的答案是 3+2=53+2=5。第三组数据中,S[1,8]S[1,8] 和 S[4,11]S[4,11] 各有 22 种优秀的拆分,其中 S[1,8]S[1,8] 是问题描述中的例子,所以答案是 2+2=42+2=4。第四组数据中,S[1,4]S[1,4],S[6,11]S[6,11],S[7,12]S[7,12],S[2,11]S[2,11],S[1,8]S[1,8] 各有 11 种优秀的拆分,S[3,14]S[3,14] 有 22 种优秀的拆分,所以答案是 5+2=75+2=7。
Solution
只要统计每个位置为左/右端点时AA的个数即可统计答案。枚举A的长度$l$,那么我们取$n/l$个相邻间隔为$l$的代表点,任意一个合法的AA必然同时包含两个相邻的代表点,且包含两个相邻代表点的合法AA的左右端点都是连续的区间,我们求出这两个代表点的最长公共前后缀即可求出区间,打上差分标记即可。枚举这些代表点的复杂度是$O(nlogn)$,用后缀数组可以$O(1)$求最长公共前后缀,总复杂度$O(nlogn)$。
Code
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
#define MN 60000
#define K 16
#define ms(a) memset(a,0,sizeof(a))
char s[MN+];
int v[MN+],A[MN*+],*sa=A,*rk=sa+MN+,*nsa=rk+MN+,*nrk=nsa+MN+;
int len,h[K][MN+],lg[MN+],L[MN+],R[MN+];
int query(int l,int r)
{
int x=lg[r-l+];
return min(h[x][l],h[x][r-(<<x)+]);
}
int lcp(int x,int y)
{
if(rk[x]>rk[y])swap(x,y);
return query(rk[x]+,rk[y]);
}
int lcs(int x,int y)
{
return lcp(*len+-x,*len+-y);
}
int main()
{
int T,n,i,j,l;long long ans;
for(i=;i<=MN;++i)lg[i]=lg[i+>>]+;
scanf("%d",&T);
while(T--)
{
ms(s);ms(v);ms(A);ms(L);ms(R);
scanf("%s",s+);len=strlen(s+);
s[len+]='a'-;n=len*+;
for(i=;i<=len;++i)s[i+len+]=s[len-i+];
for(i=;i<=n;++i)++v[s[i]];
for(i='a';i<='z';++i)v[i]+=v[i-];
for(i=;i<=n;++i)sa[v[s[i]]--]=i;
for(i=;i<=n;++i)rk[sa[i]]=rk[sa[i-]]+(s[sa[i]]!=s[sa[i-]]);
for(l=;l<n;l<<=,swap(sa,nsa),swap(rk,nrk))
{
for(i=;i<=n;++i)v[rk[sa[i]]]=i;
for(i=n;i;--i)if(sa[i]>l)nsa[v[rk[sa[i]-l]]--]=sa[i]-l;
for(i=;i<l;++i)nsa[v[rk[n-i]]--]=n-i;
for(i=;i<=n;++i)nrk[nsa[i]]=nrk[nsa[i-]]+(rk[nsa[i]]!=rk[nsa[i-]]||rk[nsa[i]+l]!=rk[nsa[i-]+l]);
}
for(i=,l=;i<=n;++i,l?--l:)
if(rk[i]>){for(j=sa[rk[i]-];s[i+l]==s[j+l];++l);h[][rk[i]]=l;}
for(i=;i<K;++i)for(j=;j+(<<i)-<=n;++j)h[i][j]=min(h[i-][j],h[i-][j+(<<i-)]);
for(i=;*i<len;++i)for(j=;j+i<=len;j+=i)
{
int a=min(lcs(j,j+i),i),b=min(lcp(j,j+i),i);
if(a+b>i)++L[j-a+],--L[j+b-i+],++R[j+i-a+i],--R[j+i+b];
}
for(ans=,i=;i<len;++i)ans+=1LL*(R[i]+=R[i-])*(L[i+]+=L[i]);
printf("%lld\n",ans);
}
}