动态规划之最长公共子序列和最长公共子串

知识引入

区分子串和子序列,给定 "pwwkew

子串是pww,wwk等很多个子串 是连在一起的

子序列是 pwk,pke等很多个子序列 ,但是子序列中的字符在字符串中不一定是连在一起的。

题目描述

 给定两个字符串,求解这两个字符串的最长公共子序列
 比如字符串1:ABCD;字符串2:AEBD
则这两个字符串的最长公共子序列长度为3,最长公共子序列是:ABD

 什么是公共子序列?请看下图

动态规划之最长公共子序列和最长公共子串

对于dp[m[n]代表str1[0,1,2...m]和str2[0,1,2...n]的最长公共子序列的长度

①如果str1[m]!=str2[n]那么两个字符串的最后一个字符都不可能是公共子序列的一部分,那么最长子序列只能从(str1[0,1,2...(m-1)]和str2[0,1,2...n])或者(str1[0,1,2...m]和str2[0,1,2...(n-1)])取最长的即dp[m][n]=max(dp[m][n-1],dp[m-1][n])

②如果str1[m]==str2[n]那么两个字符串的最后一个字符是公共子序列的一部分dp[m[n]=dp[m-1][n-1]+1

 

	public static int[][] getdp(char[] str1, char[] str2) {
		int[][] dp = new int[str1.length][str2.length];
		dp[0][0] = str1[0] == str2[0] ? 1 : 0;
		for (int m = 1; m < str1.length; m++) {
			dp[m][0] = Math.max(dp[m - 1][0], str1[m] == str2[0] ? 1 : 0);
		}
		for (int n = 1; n < str2.length; n++) {
			dp[0][n] = Math.max(dp[0][n - 1], str1[0] == str2[n] ? 1 : 0);
		}
		for (int m = 1; m < str1.length; m++) {
			for (int n = 1; n < str2.length; n++) {
				dp[m][n] = Math.max(dp[m - 1][n], dp[m][n - 1]);
				if (str1[m] == str2[n]) {
					dp[m][n] = Math.max(dp[m][n], dp[m - 1][n - 1] + 1);
				}
			}
		}
		return dp;
	}

①分别用m和n在while循环里标记两个字符串对应的下标。

②index代表公共子序列的下标

只有dp[m[n]=dp[m-1][n-1]+1时的字符才需要记录,其余的都略过(dp[m[n]=dp[m-1][n]以及dp[m[n]=dp[m][n-1]的情况)

	public static String lcse(String str1, String str2) {
		if (str1 == null || str2 == null || str1.equals("") || str2.equals("")) {
			return "";
		}
		char[] chs1 = str1.toCharArray();
		char[] chs2 = str2.toCharArray();
		int[][] dp = getdp(chs1, chs2);
		int m = chs1.length - 1;
		int n = chs2.length - 1;
		char[] res = new char[dp[m][n]];
		int index = res.length - 1;
		while (index >= 0) {
			if (n > 0 && dp[m][n] == dp[m][n - 1]) {
				n--;
			} else if (m > 0 && dp[m][n] == dp[m - 1][n]) {
				m--;
			} else {
				res[index--] = chs1[m];
				m--;
				n--;
			}
		}
		return String.valueOf(res);
	}

问题变形

问题:有两个字符串str和str2,求出两个字符串中最长公共子串长度。

比如:str=acbcbcef,str2=abcbced,则str和str2的最长公共子串为bcbce,最长公共子串长度为5。

求最长公共子串递推式为

dp[m][n]代表必须把str1[m],str2[n]作为结束字符时的最公共长子串的长度

①str1[m]==str2[n] 时 dp[m][n]=dp[m-1][n-1]+1

②str1[m]!=str2[n] 时 dp[m][n]= 0

求公共子串时end代表子串的结束位置,max代表子串长度·

public class  LCSubstring {

	public static String lcst1(String str1, String str2) {
		if (str1 == null || str2 == null || str1.equals("") || str2.equals("")) {
			return "";
		}
		char[] chs1 = str1.toCharArray();
		char[] chs2 = str2.toCharArray();
		int[][] dp = getdp(chs1, chs2);
		int end = 0;
		int max = 0;
		for (int i = 0; i < chs1.length; i++) {
			for (int j = 0; j < chs2.length; j++) {
				if (dp[i][j] > max) {
					end = i;
					max = dp[i][j];
				}
			}
		}
		return str1.substring(end - max + 1, end + 1);
	}

	public static int[][] getdp(char[] str1, char[] str2) {
		int[][] dp = new int[str1.length][str2.length];
		for (int i = 0; i < str1.length; i++) {
			if (str1[i] == str2[0]) {
				dp[i][0] = 1;
			}
		}
		for (int j = 1; j < str2.length; j++) {
			if (str1[0] == str2[j]) {
				dp[0][j] = 1;
			}
		}
		for (int i = 1; i < str1.length; i++) {
			for (int j = 1; j < str2.length; j++) {
				if (str1[i] == str2[j]) {
					dp[i][j] = dp[i - 1][j - 1] + 1;
				}
			}
		}
		return dp;
	}


	public static void main(String[] args) {
		String str1 = "ABC1234567DEFG";
		String str2 = "HIJKL1234567MNOP";
		System.out.println(lcst1(str1, str2));
		System.out.println(lcst2(str1, str2));

	}

}

 

上一篇:C++异常处理


下一篇:Java 字节数组中查找子字节数组出现的位置