题目
请从字符串中找出一个最长的不包含重复字符的子字符串,计算该最长子字符串的长度。
示例 1:
输入: "abcabcbb"
输出: 3
解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。
示例 2:
输入: "bbbbb"
输出: 1
解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。
示例 3:
输入: "pwwkew"
输出: 3
解释: 因为无重复字符的最长子串是 "wke",所以其长度为 3。
请注意,你的答案必须是 子串 的长度,"pwke" 是一个子序列,不是子串。
提示:
s.length <= 40000
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/zui-chang-bu-han-zhong-fu-zi-fu-de-zi-zi-fu-chuan-lcof
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
思路
直接暴力的时间复杂度肯定超了,显然要用动态规划。设dp[i]是以第i个字符为结尾的最长子串的长度,从dp[i-1]到dp[i]的转移公式要怎么写?我们已经知道了dp[i-1],那么只需要确认s[i]上一次出现的位置j,如果i - j > dp[i - 1],也就是说以第i-1个字符为结尾的最长的子串中不包含s[j](即s[i])这个字符,dp[i] = dp[i-1] + 1就可以成立;如果i - j <= dp[i - 1],那就是说前面的子串包括s[j]在内,则dp[i] = i - j;转移方程是:
\[dp\lbrack i\rbrack\;=\;\left\{\begin{array}{l}dp\lbrack i\;-\;1\rbrack\;+\;1,\;i\;-\;j\;>\;dp\lbrack i\;-\;1\rbrack\\i\;-\;j,\;i\;-\;j\;<=\;dp\lbrack i\;-\;1\rbrack\end{array}\right. \]那么,要怎么确定j呢?可以用一个哈希表来存储每个字符最后一次出现的位置,每次遍历字符的时候更新;这里有一个trick,对于哈希表里没有存过的字符,可以令j为-1,这样就能保证i - j一定大于dp[i - 1]。
时间复杂度和空间复杂度都是O(n)。
代码
class Solution {
public:
int lengthOfLongestSubstring(string s) {
int n = s.size();
if(n < 2) return n;
vector<int> dp(n, 0);
unordered_map<char, int> mp;
dp[0] = 1;
mp[s[0]] = 0;
for(int i = 1; i < n; ++i)
{
int j = mp.count(s[i]) ? mp[s[i]] : -1;
mp[s[i]] = i;
if(dp[i - 1] < i - j)
{
dp[i] = dp[i - 1] + 1;
}
else
{
dp[i] = i - j;
}
}
return *max_element(dp.begin(), dp.end());
}
};
改进
仔细考虑更新dp数组的过程,会发现在更新dp数组时,只需要dp[i-1],那么可以只用一个数tmp来存dp[i]的信息,同时每次更新tmp后都更新一下最长子串长度ans,空间复杂度降低到O(1),因为哈希表要额外占用的空间也是有限的(最大就是所有字符,O(128)=O(1))。
代码
class Solution {
public:
int lengthOfLongestSubstring(string s) {
unordered_map<char, int> mp;
int tmp = 0, ans = 0;
for(int i = 0; i < s.size(); ++i)
{
int j = mp.count(s[i]) ? mp[s[i]] : -1;
mp[s[i]] = i;
if(tmp < i - j)
{
++tmp;
}
else
{
tmp = i - j;
}
ans = max(ans, tmp);
}
return ans;
}
};