仅供自己学习记录
LeetCode刷题日记2021-4-3
题目描述:
给定两个字符串 text1 和 text2,返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ,返回 0 。
一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。
例如,“ace” 是 “abcde” 的子序列,但 “aec” 不是 “abcde” 的子序列。
两个字符串的 公共子序列 是这两个字符串所共同拥有的子序列。
示例 1:
输入:text1 = "abcde", text2 = "ace"
输出:3
解释:最长公共子序列是 "ace" ,它的长度为 3 。
示例 2:
输入:text1 = "abc", text2 = "abc"
输出:3
解释:最长公共子序列是 "abc" ,它的长度为 3 。
示例 3:
输入:text1 = "abc", text2 = "def"
输出:0
解释:两个字符串没有公共子序列,返回 0 。
解题思路:
假设字符串text1和text2的长度分别为m和n,创建m+1行和n+1列的二维数组dp,其中dp[i][j]表示text1[0:i]和text2[0:j]的最长公共子序列
- text1[0:i]和text2[0:j]表示text1中长度为i和text2中长度为j的前缀
边界考虑:
-
当i=0或者j=0时表示text1或text2为空字符,空字符与任何字符的最长公共子序列都为0,因此dp[0][j]和dp[i][0]都等于0
-
当i>0且j大于0时
-
当text1[i-1]=text2[j-1],将这两个字符称为公共字符,考虑text1[0:i-1]和text2[0:j-1]的最长公共子序列在增加一个字符(即公共字符)就得到text1[0:i]和text2[0:j]的最长公共字符
- 因此因此dp[i][j]=dp[i-1][j-1]+1
-
当text1[i-1]!=text2[j-1],要考虑以下两个问题:
-
text1[0:i]和text2[0:j-1]的最长公共子序列
-
text1[0:i]和text2[0:j-1]的最长公共子序列
要得到text1[0:i]和text2[0:j]的最长公共子序列就得取max(text1[0:i]和text2[0:j-1]的最长公共子序列,text1[0:i]和text2[0:j-1]的最长公共子序列)
因此dp[i][j]=max(dp[i-1][j],dp[i][j-1])
-
-
题解代码
m,n=len(text1),len(text2)
dp=[[0]*(n+1) for _ in range (m+1)]
for i in range(1,m+1):
for j in range(1,n+1):
if text1[i-1]==text2[j-1]:
dp[i][j]=dp[i-1][j-1]+1
else:
dp[i][j]=max(dp[i-1][j],dp[i][j-1])
return dp[m][n]
python避坑:
如果你是用 python 刷题,需要注意 dp二维数组 的初始化,如果你的声明方式是下面这样,那么就是错的。
dp = [[0] * N ] * M
我们知道一维数组可以用 [0] * N 这种声明方式。但是二维数组不能用上面的声明方式,这会导致 dp 中的每行的列表是同一个 id,所以对其中一行的操作都会表现为每一行的操作,如下所示。
所以,在 Python 中声明二维数组的正确方式应该是使用 for 循环:
dp = [[0] * N for _ in range(M)]
这里利用 for 循环生成每一行,则每一行都是全新的,那么就不会产生上面的问题。
来源:
https://leetcode-cn.com/problems/longest-common-subsequence/solution/fu-xue-ming-zhu-er-wei-dong-tai-gui-hua-r5ez6/
https://leetcode-cn.com/problems/longest-common-subsequence/solution/zui-chang-gong-gong-zi-xu-lie-by-leetcod-y7u0/