[leetcode 2021-1-8] 二、最长重复子串

[leetcode 2021-1-8] 二、最长重复子串

pass:解答看不懂
记 s的长度为 n。

这个问题可以分为两步:从 n−1 到 1 由大至小遍历选取长度 L,判断 s 中是否有长度为 L 的重复子串。
考虑到是子串,所以<n 以及>0
从大至小遍历的时候,第一次遇到的符合条件的 LL,即为最大的符合条件的 L,记为 L1,重复的子串为 s1。
对于满足L0<L1的L0也符合条件,s1的所有子串也是s的重复子串。对于任意满足的L2>L1的 L2, 则均不符合条件。

还是看不懂

class Solution:
    def longestDupSubstring(self, s: str) -> str:
        # 生成两个进制
        a1, a2 = random.randint(26, 100), random.randint(26, 100)
        # 生成两个模
        mod1, mod2 = random.randint(10**9+7, 2**31-1), random.randint(10**9+7, 2**31-1)
        n = len(s)
        # 先对所有字符进行编码
        arr = [ord(c)-ord('a') for c in s]
        # 二分查找的范围是[1, n-1]
        l, r = 1, n-1
        length, start = 0, -1
        while l <= r:
            m = l + (r - l + 1) // 2
            idx = self.check(arr, m, a1, a2, mod1, mod2)
            # 有重复子串,移动左边界
            if idx != -1:
                l = m + 1
                length = m
                start = idx
            # 无重复子串,移动右边界
            else:
                r = m - 1
        return s[start:start+length] if start != -1 else ""

    def check(self, arr, m, a1, a2, mod1, mod2):
        n = len(arr)
        aL1, aL2 = pow(a1, m, mod1), pow(a2, m, mod2)
        h1, h2 = 0, 0
        for i in range(m):
            h1 = (h1 * a1 + arr[i]) % mod1
            h2 = (h2 * a2 + arr[i]) % mod2
        # 存储一个编码组合是否出现过
        seen = {(h1, h2)}
        for start in range(1, n - m + 1):
            h1 = (h1 * a1 - arr[start - 1] * aL1 + arr[start + m - 1]) % mod1
            h2 = (h2 * a2 - arr[start - 1] * aL2 + arr[start + m - 1]) % mod2
            # 如果重复,则返回重复串的起点
            if (h1, h2) in seen:
                return start
            seen.add((h1, h2))
        # 没有重复,则返回-1
        return -1

上一篇:在JSP页面中进行判断


下一篇:CFGYM103176C-camelCaseCounting (SAM/SA)