给定两个长度分别为 NN 和 MM 的字符串 AA 和 BB,求既是 AA 的子序列又是 BB 的子序列的字符串长度最长是多少。
输入格式
第一行包含两个整数 NN 和 MM。
第二行包含一个长度为 NN 的字符串,表示字符串 AA。
第三行包含一个长度为 MM 的字符串,表示字符串 BB。
字符串均由小写字母构成。
输出格式
输出一个整数,表示最大长度。
数据范围
1≤N,M≤10001≤N,M≤1000
输入样例:
4 5
acbd
abedc
输出样例:
3
先来判断一下极端情况大概的估算一下时间复杂度再选择算法
假如有a,b两串,a中的元素是n,n,n,n,n...
b中的元素是n,n,n,n,n....(保证a<b)
那a,b的最长公共子序列就是a的序列,然而a的序列中的子串每个元素都有选与不选两种方案,所以是2^n种
指数型增长,一般数据范围大点的都不能枚举来做,必超时
所以应该用dp来写
令f[i][j]为集合A中1~i和B中1~j的公共子序列的最大值(根据a[i],b[j]是否相等再来分个类)
然后划分a[i],b[j]包不包含在子序列里面,有四种状态,00,01,10,11
第四类11;a[i],b[j]都选,然后a[i],b[j]是已经确定了的,是不变的,关键看前面不定的序列(前面的序列可以任意选,a[i],b[j]必选),f[i-1][j-1]+1就是这一类的最大值
第一类00:这个就类似于背包问题,a[i],b[j]都不选,那f[i][j]此时的状态就是f[i-1][j-1]
第二类01和第三类10一起说,这个y总讲的太牛逼了,对的。首先f[i-1][j]这个意思是不包含a[i],b[j]可以包含可以不包含,这个就是把01的状态全部覆盖了,虽然可能会有11的状态但没关系呀,没有总的界呀(01,11,10,00),同理可以用f[i-1][j]和f[i][j-1]这两种情况把10,01全部覆盖了,可能会涉及到一些11吧,但对结果没啥影响的
这样说,第一类额00,f[i-1][j-1]就是不包含a[i]也不包含a[j]也是全部包含在a[i-1][j],a[i][j-1]的情况里面的,所以可以不用考虑的
这个就是y总的主要思路
#include<iostream> using namespace std; const int N=1010; char a[N],b[N]; int n,m; int f[N][N]; int main(){ cin>>n>>m>>a+1>>b+1; for(int i=1;i<=n;i++) { for(int j=1;j<=m;j++) { if(a[i]==b[j]) f[i][j]=max(f[i][j],f[i-1][j-1]+1); else f[i][j]=max(f[i-1][j],f[i][j-1]); } } cout<<f[n][m]<<endl; return 0; }
结合思路,代码一看就懂