正题
题目大意
给出一个长度为\(n\)的字符串\(a\),求它的所有子序列的本质不同子序列个数。
\(1\leq n\leq 10^6\)
解题思路
考虑每个子序列产生的贡献,为了防止算重我们一个只统计走子序列自动机上的边的子序列,也就是说对于\(T\)对\(S\)产生贡献当且仅当\(T\)中没有任何一个字符能在\(S\)上匹配到更前的位置。
设\(f_i\)表示以位置\(i\)结尾的子序列产生的贡献和,\(g_i\)表示目前以字符\(i\)结尾的贡献和是多少。
那么每次\(f\)直接用\(g\)来做,然后再用\(f\)更新\(g\),具体地如果下一个字符和这个字符不能那么可以选择也可以不选择所以\(g_j\)需要乘二,否则不乘就好了。
时间复杂度:\(O(26n)\)
code
#include<cstdio>
#include<cstring>
#include<algorithm>
#define ll long long
using namespace std;
const ll N=1e6+10,P=1e9+7;
ll n,ans,g[26],pw[N];
char s[N];
signed main()
{
scanf("%s",s+1);
n=strlen(s+1);
for(int i=0;i<26;i++)g[i]=1;
pw[0]=1;for(ll i=1;i<=n;i++)pw[i]=pw[i-1]*2%P;
for(ll i=1;i<=n;i++){
ll c=s[i]-'a',f=g[c];
ans=(ans+f*pw[n-i])%P;
for(ll j=0;j<26;j++){
if(j==c)g[j]=(g[j]+f)%P;
else g[j]=(g[j]*2ll+f)%P;
}
}
printf("%lld\n",ans);
return 0;
}