[饭后算法系列] 数组中"和非负"的最长子数组

1. 问题

给定一列数字数组 a[n], 求这个数组中最长的 "和>=0" 的子数组. (注: "子数组"表示下标必须是连续的. 另一个概念"子序列"则不必连续)

举个例子:

数组 a[n] = {1, 2, -4, 5, -6, 1}, 最长的和非负的子数组为 {1, 2, -4, 5}, 其他子数组要么和<0, 要么长度<4

2. 暴力法

我们先来看看暴力解法和时间复杂度

1. 如果我求出所有的数组前缀和 即P(i) = a[1]到a[i]的和

2. 然后对于数组的所有子数组 a[i..j], 它的和为 P(j) - P(i-1)

第一步预处理的时间复杂度为O(n). 第二步是暴力法的主体, 穷举了所有O(n^2)个子数组, 每个子数组和的计算需要时间O(1). 因此整个算法的时间复杂度就是O(n^2)

由此可见, 任何优化必须使得复杂度小于 O(n^2)

3. 算法优化

算法是一门基于观察的学科, 让我们先从例子入手, 观察一下优化的方法

对于数组a[n], 用动态规划法从第一个数开始往后遍历

1 2 -4 5 -6 1
(1,1) (2,3) (3,-1) (4,4) (5,-2) (6,-1)
  (1,2) (2,-2) (3,3) (4,-3) (5,-2)
    (1,-4) (2,1) (3,-5) (4,-4)
      (1,5) (2,-1) (3, 0)
        (1,-6) (2,-5)
          (1, 1)

1. 遍历到第一个数1时, 填写(1,1), 表示第一个数的和为1

2. 遍历到第二个数2时, 填写(2,3), 表示前两个数的和为3; 填写(1,2), 表示前一个数(即2自己)的和为2

以此类推, 填完所有6列, 可以看到第4列的(4,4)是和为4>=0, 且长度最长的结果

这个做法仍然需要O(n^2), 有什么办法优化呢?

3.1 计算简化

这个表格的计算是可以简化的:

  1 2 -4 5 -6 1
  0          
    -1        
      -3      
        1    
          -4  
            2
sum 1 3 -1 4 -2 -1

这是什么意思呢?

假设运算到第k列的时候, 所有以a[k]结尾的子数组和记为b[k] = [sum(1..k), sum(2..k), ..., sum(k..k)]

我只要记录b[k]的变形c[k]即可, c[k] = [0, -sum(1..1), -sum(1..2), ..., -sum(1..k-1)], 要从c[k]转回b[k], 我只要简单的把c中的每个元素值加上sum(1..k)

这样做的好处是: 我从c[k]前进到c[k+1]的时候, 只要简单地在最后加一个元素-sum(1..k), 而不需要修改前面的元素. 这使得前进一步的开销为O(1)

转化后, 我要找b[k]中>=0的元素, 等同于找c[k]中>=-sum(1..k)的元素, 这个查找过程怎么简化呢?

3.2 单调优化

这个过程是可以发现单调性优化的. 为了方便, 我把表格转回最开始的样子:

1 2 -4 5 -6 1
(1,1) (2,3) (3,-1) (4,4) (5,-2) (6,-1)
  (1,2) (2,-2) (3,3) (4,-3) (5,-2)
    (1,-4) (2,1) (3,-5) (4,-4)
      (1,5) (2,-1) (3, 0)
        (1,-6) (2,-5)
          (1, 1)

被飘灰的这些格子, 在同一列中, 都有长度以及总和都比它大的另一个格子. 这些飘灰的格子一定不在最终的结果中.

比如第3列中, (2,-2)的上面有(3,-1). 也就是-4往前加2个数的和为-2, 往前加3个数的和为-1. 如果最终答案包含了-4往前的2个数, 那我一定能够换成-4往前3个数, 总和比原来大了1, 且长度也比原来长

去掉飘灰的这些格子后, 我们发现, 每一列的第二个数(和)是单调递增的.

因为我要找每列第二个数(和)>=0的格子, 由于有了单调性之后, 我就能用二分查找了, 查找的复杂度为O(lgn)

3.3 总结

综合3.1和3.2, 在这个动态规划过程中, 遍历的每一步, 时间复杂度=O(1)+O(lgn), 总共遍历n次, 因此总的时间复杂度为O(nlgn)

关键字: 算法, 动态规划, 数组

上一篇:Winform TreeView控件技巧


下一篇:分数规划模板(洛谷P4377 [USACO18OPEN]Talent Show)(分数规划,二分答案,背包)