最长公共子序列（LCS）、最长递增子序列（LIS）、最长递增公共子序列（LICS）

2022-10-21 11:12:25

最长公共子序列（LCS）

【问题】求两字符序列的最长公共字符子序列

问题描述：字符序列的子序列是指从给定字符序列中随意地（不一定连续）去掉若干个字符（可能一个也不去掉）后所形成的字符序列。令给定的字符序列X=“x0，x1，…，xm-1”，序列Y=“y0，y1，…，yk-1”是X的子序列，存在X的一个严格递增下标序列<i0，i1，…，ik-1>，使得对所有的j=0，1，…，k-1，有xij=yj。例如，X=“ABCBDAB”，Y=“BCDB”是X的一个子序列。

考虑最长公共子序列问题如何分解成子问题，设A=“a0，a1，…，am-1”，B=“b0，b1，…，bm-1”，并Z=“z0，z1，…，zk-1”为它们的最长公共子序列。不难证明有以下性质：

（1）如果am-1=bn-1，则zk-1=am-1=bn-1，且“z0，z1，…，zk-2”是“a0，a1，…，am-2”和“b0，b1，…，bn-2”的一个最长公共子序列；

（2）如果am-1!=bn-1，则若zk-1!=am-1，蕴涵“z0，z1，…，zk-1”是“a0，a1，…，am-2”和“b0，b1，…，bn-1”的一个最长公共子序列；

（3）如果am-1!=bn-1，则若zk-1!=bn-1，蕴涵“z0，z1，…，zk-1”是“a0，a1，…，am-1”和“b0，b1，…，bn-2”的一个最长公共子序列。

这样，在找A和B的公共子序列时，如有am-1=bn-1，则进一步解决一个子问题，找“a0，a1，…，am-2”和“b0，b1，…，bm-2”的一个最长公共子序列；如果am-1!=bn-1，则要解决两个子问题，找出“a0，a1，…，am-2”和“b0，b1，…，bn-1”的一个最长公共子序列和找出“a0，a1，…，am-1”和“b0，b1，…，bn-2”的一个最长公共子序列，再取两者中较长者作为A和B的最长公共子序列。

求解：

引进一个二维数组c[][]，用c[i][j]记录X[i]与Y[j] 的LCS 的长度，b[i][j]记录c[i][j]是通过哪一个子问题的值求得的，以决定搜索的方向。
我们是自底向上进行递推计算，那么在计算c[i,j]之前，c[i-1][j-1]，c[i-1][j]与c[i][j-1]均已计算出来。此时我们根据X[i] = Y[j]还是X[i] != Y[j]，就可以计算出c[i][j]。

问题的递归式写成：

回溯输出最长公共子序列过程：

算法分析：
由于每次调用至少向上或向左（或向上向左同时）移动一步，故最多调用(m + n)次就会遇到i = 0或j = 0的情况，此时开始返回。返回时与递归调用时方向相反，步数相同，故算法时间复杂度为Θ(m + n)。

那么以HDU 1159来做演示、

 #include<cstring>

 #include<cmath>

 #include<cstring>

 #include<cstdio>

 const int qq=1e3+;

 char x[qq],y[qq];

 int dp[qq][qq];

 int main()

 {

     while(~scanf("%s%s",x+,y+)){

         x[]=y[]='.';

         int len=strlen(x)>strlen(y)?strlen(x):strlen(y);

     //    printf("%d %d\n",strlen(x),strlen(y));

         for(int i=;i<=len;++i)

             dp[i][]=dp[][i]=;

         for(int j,i=;i<strlen(x);++i)

             for(j=;j<strlen(y);++j)

                 if(x[i]==y[j])

                     dp[i][j]=dp[i-][j-]+;

                 else

                     dp[i][j]=dp[i-][j]>dp[i][j-]?dp[i-][j]:dp[i][j-];

         printf("%d\n",dp[strlen(x)-][strlen(y)-]);

     }

     return ;

 }

最长递增子序列（LIS）

以POJ 2533来讲解吧、

现在给你一个序列，要你求最长上升子序列，那么把这个序列排一个序，然后和原有序列进行LCS 是不是就解决问题了呢？

当然还有dp思路了、

dp[ i ]以序列中第i个元素结尾的最长上升子序列的长度

那么状态转移方程为：if (a[i] > a[j]) dp[i] = MAX (dp[i], dp[j] + 1);

 #include<cstdio>

 #include<cmath>

 #include<cstring>

 const int qq=;

 int dp[qq];

 int num[qq];

 int main()

 {

     int n;

     while(~scanf("%d",&n)){

         memset(dp,,sizeof(dp));        // 5 6 7 8 1

         for(int i=;i<n;++i)

         scanf("%d",&num[i]);

         dp[]=;

         int x=;

         for(int j,i=;i<n;++i){

             int maxn=;

             for(j=;j<i;++j)    //这里利用了递推的原理、

                 if(num[i]>num[j])    //由前面的最长递增子序列推出后面的最长递增子序列、

                     maxn=maxn>dp[j]?maxn:dp[j];

             dp[i]=maxn+;

             if(dp[i]>x)    x=dp[i];    //x记录的是当前的最大值、

         }

         printf("%d\n",x);

     }

     return ;

 }

对于LIS还有一种O（n*logn）的做法、

这里以HDU 1025为例、

转载自 kuangbin

假设要寻找最长上升子序列的序列是a[n]，然后寻找到的递增子序列放入到数组b中。

（1）当遍历到数组a的第一个元素的时候，就将这个元素放入到b数组中，以后遍历到的元素都和已经放入到b数组中的元素进行比较；

（2）如果比b数组中的每个元素都大，则将该元素插入到b数组的最后一个元素，并且b数组的长度要加1；

（3）如果比b数组中最后一个元素小，就要运用二分法进行查找，查找出第一个比该元素大的最小的元素，然后将其替换。

在这个过程中，只重复执行这两步就可以了，最后b数组的长度就是最长的上升子序列长度。例如：如该数列为：

5 9 4 1 3 7 6 7

那么：

5 //加入
5 9 //加入
4 9 //用4代替了5
1 9 //用1代替4
1 3 //用3代替9
1 3 7 //加入
1 3 6 //用6代替7
1 3 6 7 //加入

最后b中元素的个数就是最长递增子序列的大小，即4。

要注意的是最后数组里的元素并不就一定是所求的序列，

例如如果输入 2 5 1

那么最后得到的数组应该是 1 5

而实际上要求的序列是 2 5

 #include<iostream>

 #include<algorithm>

 #include<cstdio>

 #include<cstring>

 const int qq=+;

 int city[qq];

 int dp[qq]={};

 int search(int x,int l,int r)

 {            //二分查找找到一个位置，使得x>dp[i-1], 并且x<dp[i],并用x代替dp[i]

     int m;

     while(l<=r){

         m=(l+r)>>;

         if(x>=dp[m])    l=m+;

         else            r=m-;

     }

     return l;

 }

 int DP(int n)

 {

     int i,len;

     dp[]=city[];

     len=;

     for(int i=;i<=n;++i){

         if(city[i]>=dp[len]){

             len=len+;

             dp[len]=city[i];

         }

         else{

             int temp=search(city[i],,len);

             dp[temp]=city[i];

         }

     }

     return len;

 }

 int main()

 {

     int n;

     int t=;

     while(~scanf("%d",&n)){

         int a,b;

         for(int i=;i<n;++i){

             scanf("%d%d",&a,&b);

             city[a]=b;

         }

         int maxn=DP(n);

         printf("Case %d:\n",t++);

         if(maxn==)    printf("My king, at most 1 road can be built.\n\n");//注意这里road的复数问题，超级坑

         else    printf("My king, at most %d roads can be built.\n\n",maxn);

         memset(dp,,sizeof(dp));

     }

     return ;

 }

最长递增公共子序列（LICS）

转载：传送门

那么以ZOJ的2432为例、

最长公共上升子序列（LCIS）的O(n^2)算法

预备知识：动态规划的基本思想，LCS，LIS。

问题：字符串a，字符串b，求a和b的LCIS（最长公共上升子序列）。

首先我们可以看到，这个问题具有相当多的重叠子问题。于是我们想到用DP搞。DP的首要任务是什么？定义状态。

1定义状态F[i][j]表示以a串的前i个字符b串的前j个字符且以b[j]为结尾构成的LCIS的长度。

为什么是这个而不是其他的状态定义？最重要的原因是我只会这个，还有一个原因是我知道这个定义能搞到平方的算法。而我这只会这个的原因是，这个状态定义实在是太好用了。这一点我后面再说。

我们来考察一下这个这个状态。思考这个状态能转移到哪些状态似乎有些棘手，如果把思路逆转一下，考察这个状态的最优值依赖于哪些状态，就容易许多了。这个状态依赖于哪些状态呢？

首先，在a[i]!=b[j]的时候有F[i][j]=F[i-1][j]。为什么呢？因为F[i][j]是以b[j]为结尾的LCIS，如果F[i][j]>0那么就说明a[1]..a[i]中必然有一个字符a[k]等于b[j]（如果F[i][j]等于0呢？那赋值与否都没有什么影响了）。因为a[k]!=a[i]，那么a[i]对F[i][j]没有贡献，于是我们不考虑它照样能得出F[i][j]的最优值。所以在a[i]!=b[j]的情况下必然有F[i][j]=F[i-1][j]。这一点参考LCS的处理方法。

那如果a[i]==b[j]呢？首先，这个等于起码保证了长度为1的LCIS。然后我们还需要去找一个最长的且能让b[j]接在其末尾的LCIS。之前最长的LCIS在哪呢？首先我们要去找的F数组的第一维必然是i-1。因为i已经拿去和b[j]配对去了，不能用了。并且也不能是i-2，因为i-1必然比i-2更优。第二维呢？那就需要枚举b[1]..b[j-1]了，因为你不知道这里面哪个最长且哪个小于b[j]。这里还有一个问题，可不可能不配对呢？也就是在a[i]==b[j]的情况下，需不需要考虑F[i][j]=F[i-1][j]的决策呢？答案是不需要。因为如果b[j]不和a[i]配对，那就是和之前的a[1]..a[j-1]配对（假设F[i-1][j]>0，等于0不考虑），这样必然没有和a[i]配对优越。（为什么必然呢？因为b[j]和a[i]配对之后的转移是max(F[i-1][k])+1，而和之前的i`配对则是max(F[i`-1][k])+1。显然有F[i][j]>F[i`][j],i`>i）

于是我们得出了状态转移方程：

a[i]!=b[j]: F[i][j]=F[i-1][j]

a[i]==b[j]: F[i][j]=max(F[i-1][k])+1 1<=k<=j-1&&b[j]>b[k]

不难看到，这是一个时间复杂度为O(n^3)的DP，离平方还有一段距离。

但是，这个算法最关键的是，如果按照一个合理的递推顺序，max(F[i-1][k])的值我们可以在之前访问F[i][k]的时候通过维护更新一个max变量得到。怎么得到呢？首先递推的顺序必须是状态的第一维在外层循环，第二维在内层循环。也就是算好了F[1][len(b)]再去算F[2][1]。

如果按照这个递推顺序我们可以在每次外层循环的开始加上令一个max变量为0，然后开始内层循环。当a[i]>b[j]的时候令max=F[i-1][j]。如果循环到了a[i]==b[j]的时候，则令F[i][j]=max+1。

最后答案是F[len(a)][1]..F[len(a)][len(b)]的最大值。

 #include<cmath>

 #include<cstdio>

 #include<cstring>

 const int qq=;

 int a[qq],b[qq];

 int dp[qq][qq];

 int prex[qq][qq];

 int prey[qq][qq];

 int count,ans;

 void out(int x,int y)    //递归输出路径、

 {

     if(dp[x][y]==)    return;

     int xx=prex[x][y];

     int yy=prey[x][y];

     out(xx,yy);

     if(dp[x][y]!=dp[xx][yy] && y!=){

         printf("%d",b[y]);

         count++;

         if(count<ans)    printf(" ");

         else            printf("\n");

     }

 }

 int main()

 {

     int t;scanf("%d",&t);

     while(t--){

         int n;

         scanf("%d",&n);

         for(int i=;i<=n;++i)

             scanf("%d",&a[i]);

         int m;

         scanf("%d",&m);

         for(int i=;i<=m;++i)

             scanf("%d",&b[i]);

         memset(prex,-,sizeof(prex));

         memset(prey,-,sizeof(prey));

         memset(dp,,sizeof(dp));

         for(int j,i=;i<=n;++i){

             int maxn=;

             int x,y;x=y=;

             for(j=;j<=m;++j){

                 dp[i][j]=dp[i-][j];        //先更新状态，如果后面会更新的话再去更新

                 prex[i][j]=i-;

                 prey[i][j]=j;

                 if(a[i]>b[j] && maxn<dp[i-][j]){    //我开始一直没想通为什么要在a[i]>b[j]的时候才更新值

                     maxn=dp[i-][j];// 其实你想想dp[i][j]中i,j都有什么含义、

                     x=i-;        // 这个if里面更新出来的maxn只有在满足a[i]==b[j]的时候才有用、

                     y=j;    //  这里更新出来的值就是为了保证当a[i]==b[j]的时候

                 }            //所更新出来的最大值是一个递增的子序列、

                 else if(a[i]==b[j]){

                     dp[i][j]=maxn+;

                     prex[i][j]=x;

                     prey[i][j]=y;

                 }

             }

         }

         for(int i=;i<=n;++i){

             for(int j=;j<=m;++j)

                 printf("%d ",dp[i][j]);

             printf("\n");

         }

         ans=;

         int flag=-;

         for(int i=;i<=m;++i){

             if(ans<dp[n][i]){

                 flag=i;

                 ans=dp[n][i];

             }

         }

         printf("%d\n",ans);

         int x=n,y=flag;

         count=;

         if(ans>)

             out(x,y);

         if(t)    printf("\n");

     }

     return ;

 }

码农公寓

相关文章