知识引入
区分子串和子序列,给定 "pwwkew"
子串是pww,wwk等很多个子串 是连在一起的
子序列是 pwk,pke等很多个子序列 ,但是子序列中的字符在字符串中不一定是连在一起的。
题目描述
给定两个字符串,求解这两个字符串的最长公共子序列
比如字符串1:ABCD;字符串2:AEBD
则这两个字符串的最长公共子序列长度为3,最长公共子序列是:ABD
什么是公共子序列?请看下图
对于dp[m[n]代表str1[0,1,2...m]和str2[0,1,2...n]的最长公共子序列的长度
①如果str1[m]!=str2[n]那么两个字符串的最后一个字符都不可能是公共子序列的一部分,那么最长子序列只能从(str1[0,1,2...(m-1)]和str2[0,1,2...n])或者(str1[0,1,2...m]和str2[0,1,2...(n-1)])取最长的即dp[m][n]=max(dp[m][n-1],dp[m-1][n])
②如果str1[m]==str2[n]那么两个字符串的最后一个字符是公共子序列的一部分dp[m[n]=dp[m-1][n-1]+1
public static int[][] getdp(char[] str1, char[] str2) {
int[][] dp = new int[str1.length][str2.length];
dp[0][0] = str1[0] == str2[0] ? 1 : 0;
for (int m = 1; m < str1.length; m++) {
dp[m][0] = Math.max(dp[m - 1][0], str1[m] == str2[0] ? 1 : 0);
}
for (int n = 1; n < str2.length; n++) {
dp[0][n] = Math.max(dp[0][n - 1], str1[0] == str2[n] ? 1 : 0);
}
for (int m = 1; m < str1.length; m++) {
for (int n = 1; n < str2.length; n++) {
dp[m][n] = Math.max(dp[m - 1][n], dp[m][n - 1]);
if (str1[m] == str2[n]) {
dp[m][n] = Math.max(dp[m][n], dp[m - 1][n - 1] + 1);
}
}
}
return dp;
}
①分别用m和n在while循环里标记两个字符串对应的下标。
②index代表公共子序列的下标
只有dp[m[n]=dp[m-1][n-1]+1时的字符才需要记录,其余的都略过(dp[m[n]=dp[m-1][n]以及dp[m[n]=dp[m][n-1]的情况)
public static String lcse(String str1, String str2) {
if (str1 == null || str2 == null || str1.equals("") || str2.equals("")) {
return "";
}
char[] chs1 = str1.toCharArray();
char[] chs2 = str2.toCharArray();
int[][] dp = getdp(chs1, chs2);
int m = chs1.length - 1;
int n = chs2.length - 1;
char[] res = new char[dp[m][n]];
int index = res.length - 1;
while (index >= 0) {
if (n > 0 && dp[m][n] == dp[m][n - 1]) {
n--;
} else if (m > 0 && dp[m][n] == dp[m - 1][n]) {
m--;
} else {
res[index--] = chs1[m];
m--;
n--;
}
}
return String.valueOf(res);
}
问题变形
问题:有两个字符串str和str2,求出两个字符串中最长公共子串长度。
比如:str=acbcbcef,str2=abcbced,则str和str2的最长公共子串为bcbce,最长公共子串长度为5。
求最长公共子串递推式为
dp[m][n]代表必须把str1[m],str2[n]作为结束字符时的最公共长子串的长度
①str1[m]==str2[n] 时 dp[m][n]=dp[m-1][n-1]+1
②str1[m]!=str2[n] 时 dp[m][n]= 0
求公共子串时end代表子串的结束位置,max代表子串长度·
public class LCSubstring {
public static String lcst1(String str1, String str2) {
if (str1 == null || str2 == null || str1.equals("") || str2.equals("")) {
return "";
}
char[] chs1 = str1.toCharArray();
char[] chs2 = str2.toCharArray();
int[][] dp = getdp(chs1, chs2);
int end = 0;
int max = 0;
for (int i = 0; i < chs1.length; i++) {
for (int j = 0; j < chs2.length; j++) {
if (dp[i][j] > max) {
end = i;
max = dp[i][j];
}
}
}
return str1.substring(end - max + 1, end + 1);
}
public static int[][] getdp(char[] str1, char[] str2) {
int[][] dp = new int[str1.length][str2.length];
for (int i = 0; i < str1.length; i++) {
if (str1[i] == str2[0]) {
dp[i][0] = 1;
}
}
for (int j = 1; j < str2.length; j++) {
if (str1[0] == str2[j]) {
dp[0][j] = 1;
}
}
for (int i = 1; i < str1.length; i++) {
for (int j = 1; j < str2.length; j++) {
if (str1[i] == str2[j]) {
dp[i][j] = dp[i - 1][j - 1] + 1;
}
}
}
return dp;
}
public static void main(String[] args) {
String str1 = "ABC1234567DEFG";
String str2 = "HIJKL1234567MNOP";
System.out.println(lcst1(str1, str2));
System.out.println(lcst2(str1, str2));
}
}