[算法模版]子序列DP
如何求本质不同子序列个数?
朴素DP
复杂度为\(O(nq)\)。其中\(q\)为字符集大小。
\(dp[i]\)代表以第\(i\)个数结尾的本质不同子序列个数。注意,这里对于每一个字符,只计算上一个相同字符带来的贡献。如果全部计算的话会算重复。
最后统计答案的时候也只统计每个字符最后一次出现的位置的答案。
例题:【线上训练13】子序列 中的50分部分分
#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
#include<algorithm>
using namespace std;
const int maxn=2e6+100,mod=998244353;
typedef long long ll;
char s[2][maxn],ori[maxn];
int n,len=1;
int last[30];
ll dp[maxn];
void init() {
scanf("%s",ori+1);
s[1][1]=ori[1];
for(int i=2;i<=n;i++) {
int md=i&1;
for(int j=1;j<=len;j++) {
s[md][2*j-1]=ori[i];
s[md][2*j]=s[md^1][j];
}
s[md][2*len+1]=ori[i];
len=2*len+1;
}
}
int main() {
scanf("%d",&n);
init();
scanf("%s",s[n&1]+1);len=strlen(s[n&1]+1);
for(int i=1;i<=len;i++) {
int ty=s[n&1][i]-'a';
dp[i]=1;
for(int j=0;j<26;j++) {
if(last[j]){
dp[i]+=dp[last[j]];
}
}
dp[i]%=mod;
last[ty]=i;
}
ll ans=0;
for(int i=0;i<26;i++) {
if(last[i])ans+=dp[last[i]];
ans%=mod;
}
ans%=mod;
printf("%lld",ans);
}
优化DP
我们令\(f[i]=\sum_{j=1}^q dp[last[c[j]]]\)。其中\(q\)为字符集大小,\(c\)字符集。
转移的时候有两种情况:
- 当前字符未出现过(第一个)。那么令\(dp[i]=f[i-1]+1\),则\(f[i]=2\times f[i-1]+1\)。
- 当前字符在原来出现过。那么令\(dp[i]=f[i-1]+1\)。因为只记录最后一次,所以在给\(f\)加上这一次的\(dp\)值之后还要删去上一次的\(dp\)值。\(f[i]=2\times f[i-1]-dp[last[i]]+1\)。因为\(dp[last[i]]=f[last[i]-1]+1\),所以\(f[i]=2\times f[i-1]-f[last[i]-1]\)
其实本质就是利用子序列DP每次增加的都是\(\sum dp[每一个字符]\)这个特性,每次转移将\(\sum dp[每一个字符]\)用\(O(1)\)复杂度起来,做到\(O(1)\)的转移。
算法复杂度\(O(n)\)
例题:FZU-2129
#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
using namespace std;
int n,a[1000500],f[1000500],last[1000500],ans=0;
const int mod=1e9+7;
int main() {
ios::sync_with_stdio(0);
while(cin>>n) {
for(int i=1;i<=n;i++)cin>>a[i];ans=0;
memset(f,0,sizeof(f));memset(last,0,sizeof(last));
for(int i=1;i<=n;i++) {
if(!last[a[i]])f[i]=(2ll*f[i-1]+1)%mod;
else f[i]=(2ll*f[i-1]-f[last[a[i]]-1])%mod;
last[a[i]]=i;
}
ans=(f[n]%mod+mod)%mod;
cout<<ans<<endl;
}
return 0;
}
矩阵优化
我们可以发现,朴素DP的DP状态可以写成矩阵形式:
\\ dp[i][b]
\\ dp[i][c]
\\ ...
\\ ...
\\ ...
\\ dp[i][z]
\\1
\end{bmatrix}
\]
这里我们为了方便的进行矩阵转移添加了一维,\(dp[i][c]\)指对于前\(i\)个字符,最后一个字符是\(c\)的子序列个数。
那么字符串第\(i\)位的字符\(s[i]\)的状态可以这样转移:\(dp[i][s[i]]=\sum dp[i-1][任意字符]+1\)。
其他情况这样转移:\(dp[i][c]=dp[i-1][c]\)
我们发现这样的转移是可以构造出转移矩阵的。那么对于字符"c"的转移矩阵应该是这样的:
1&0 &0 &0 &0 &0 &0 &0\\
0&1 &0 &0 &0 &0 &0 &0\\
1&1 &1 &1 &1 &1 &1 &1\\
0&0 &0 &1 &0 &0 &0 &0\\
0&0 &0 &0 &1 &0 &0 &0\\
0&0 &0 &0 &0 &1 &0 &0\\
&&&...\\
0&0 &0 &0 &0 &0 &0 &1
\end{bmatrix}
\]
就是在单位矩阵上,将字符"c"对应的那一行(第三行)全部设置为1。
转移矩阵的最后一列比较特殊,我们使用最后一列来达到“+1”的效果。
构造出每个字符对应的转移矩阵后。我们每次只需要把状态矩阵乘上第\(i\)个字符\(s[i]\)的转移矩阵,就能得到新的转移矩阵。
普通情况下的合并子序列状态
上面这个矩阵最主要的作用就是拿来合并两个字符串的子序列状态。因为一个子序列状态是一个状态矩阵乘上所有转移矩阵的乘积。所以如果我们分别知道字符串\(s\)和\(t\)的转移矩阵乘积,我们就能轻松的得出\(st\)的转移矩阵乘积,从而得到字符串\(st\)的本质不同子序列个数。
但是这样显然是亏本的。一次合并的复杂度为\(O(len\times q^3)\)。其中\(q\)为字符集大小。直接\(O(n)\)DP一次不知道比它高到哪里去了。
特殊情况下的合并子序列状态
但是这种矩阵合并还是有一些用处的。当新的序列出现某种规律时(例如新串=旧串*2),我们就可以“重复使用”这个矩阵。显然是赚了的。