看了那么久的四边形不等式优化的原理,今天终于要写一篇关于它的证明了。
在平时的做题中,我们会遇到这样的区间dp问题
它的状态转移方程形式一般为dp[i][j]=min(dp[i][k]+dp[k+1][j]+cost[i][j]);(或者是max(........),本博客以min为例来证明)
熟悉一般区间dp的同学应该清楚我们如果想得到最终的答案,一般要用三层for循环来计算(第一层为长度,第二层枚举起始点,第三层在起始点i和终点j之间寻找最优的分割点)。显而易见它的时间复杂度为o(n^3),但是当cost满足四边形不等式的要求时我们就可以将他优化为o(n^2)。
为什么可以这样呢,请慢慢往下看
首先什么是满足四边形不等式呢
满足四边形不等式用通俗话来讲就是对于一个区间值关系,如果它满足交叉小于包含的话,那么就说它是满足四边形不等式的。
例如当i < i' <= j < j'时,对于cost的值来说,如果它满足 cost[i][j]+cost[i'][j']<=cost[i][j']+cost[i'][j] 的关系时,那么我们就说它满足四边形不等式。
我们如果想证明一个区间值关系是否满足四边形不等式,光依靠上面的式子来判断还是有点困难的,我们不妨把上面的式子变动一下
我们以 i+1 来替换 i‘ ,以 j+1 来替换 j’ (即 i < i+1<= j < j+1 ),得到下面的式子
即当我们证明了 cost[i][j]+cost[i+1][j+1]<=cost[i][j+1]+cost[i+1][j] 时 ,我们就证明了它满足四边形不等式
我们把它移一下项
变成 cost[i][j]-cost[i+1][j]<=cost[i][j+1]-cost[i+1][j+1]
也就是证明函数F( j )=cost[i][j]-cost[i+1][j] 递增(即F( j )<=F( j+1 ))
当我们的花费数组cost[i][j]满足四边形不等式时,我们怎么将dp的时间复杂度优化为o(n^2)呢?
不幸的是,我们还要证明dp[i][j]满足四边形不等式才行,但是dp数组是我们要求的,它不是已知的,我们怎么知道它满不满足呢。
还记得我们刚刚证明了cost满足四边形不等式了吗,我们可以利用cost来推出dp满足四边形不等式
即证当 i< i+1<=j< j+1 时
dp[i][j]+dp[i+1][j+1]<=dp[i+1][j]+dp[i][j+1]
这个证明有点抽象,我先以一道题目为例使它更加容易理解
样例
7
13 7 8 16 21 4 18
输出
239
我们利用数学归纳法来证明dp数组满足四边形不等式(学过高等数学的同学应该不陌生)(如果你不知道什么是数学归纳法的话请点这里)
我们要证明dp[i][j] + dp[i+1][j+1] <= dp[i][j+1]+dp[i+1][j]成立(i < i+1 <= j < j+1)
1.当 i=1,j=2时(此时i+1=j)
因为
dp[1][1]=dp[2][2]=dp[3][3]=0,
dp[1][2]=w[1][2],dp[2][3]=w[2][3],
dp[1][3]>=w[1][3]
而由四边形不等式可知
w[1][2]+w[2][3]<=w[1][3]+w[2][2]
显然dp[1][2]+dp[2][3]<=dp[1][3]+dp[2][2]成立
2.我们令dp[i][j+1]取得最优值的时候k=x
令dp[i+1][j]取得最优值的时候k=y
当x < =y时(之后还要令x > y的情况类似)
我们假设dp[x+1][j] + dp[y+1][j+1] <= dp[x+1][j+1] + dp[y+1][j] 成立 (此时x+1 <= y+1 <= j < j+1)
这一步是数学归纳法中重要的一部分,先假设小范围的成立,然后推出大范围的成立
对于(i < i+1<=j<j+1)
显然
dp[i][j] <= dp[i][x] + dp[x+1][j] + cost[i][j]
dp[i+1][j+1] <= dp[i+1][y] + dp[y+1][j+1] + cost[i+1][j+1]
dp[i][j] + dp[i+1][j+1]<=dp[i][x] + dp[x+1][j] + cost[i][j] + dp[i+1][y] + dp[y+1][j+1] + cost[i+1][j+1]
又因为cost满足四边形不等式
cost[i][j] + cost[i+1][j+1] <= cost[i][j+1] + cost[i+1][j]
所以dp[i][x] + dp[x+1][j] + cost[i][j] + dp[i+1][y] + dp[y+1][j+1] + cost[i+1][j+1]
<= dp[i][x] + dp[x+1][j] + cost[i][j+1] + dp[i+1][y] + dp[y+1][j+1] + cost[i+1][j]
又因为dp[x+1][j] + dp[y+1][j+1] <= dp[x+1][j+1] + dp[y+1][j] 成立
所以dp[i][x] + dp[x+1][j] + cost[i][j+1] + dp[i+1][y] + dp[y+1][j+1] + cost[i+1][j]
<= dp[i][x] + dp[x+1][j+1] + cost[i][j+1] + dp[i+1][y] + dp[y+1][j] + cost[i+1][j]
=dp[i][j+1]+dp[i+1][j]
即dp[i][j] + dp[i+1][j+1] <= dp[i][j+1]+dp[i+1][j] 成立
(x+1 <= y+1 <= j < j+1)是包含在(i < i+1 <= j < j+1)里的
综上,由数学归纳法得证dp也满足四边形不等式
不理解的同学可以这样想想,显然dp[1][1],dp[2][2].....dp[n-1][n-1],dp[n][n]的值在本题中显然为0,它是满足四边形不等式的(此时dp长度为1)
而dp[1][2],dp[2][3].....dp[n-2][n-1],dp[n-1][n]的值显然为cost[1][2],cost[2][3].....cost[n-2][n-1],cost[n-1][n], 它是满足四边形不等式的(由dp[1][2]+dp[2][3]<=dp[1][3]+dp[2][2]成立可以类比推出来)
(此时dp的长度为n-(n-1)+1=2,即长度为2,枚举每个起点,知道长度,得到他们的dp值)
对于dp长度为3的值,它一定是长度小于它的dp值推出来的,所以,当长度小于它的dp值满足四边形不等式时,我们可以推出当前长度为3的dp值也满足四边形不等式
一直只要依次推下去,就可以得到dp是满足四边形不等式的
现在我们推出了dp是满足四边形不等式的
我们现在就可以尝试去降低算法的时间复杂度了
那它是怎么降低的呢?
我们只要证明最后一样关系式就可以了
即s[i][j-1]<=s[i][j]<=s[i+1][j](s[i][j]表示dp[i][j]的最优分割点(dp[i][j]=min(t|dp[i][t]+dp[t+1][j]+cost[i][j])))
我们令d=s[i][j-1] , k <= d
cut=x 表示以x为分割点的dp值(即dp[i][j]=dp[i][x]+dp[x+1][j]+cost[i][j])
构造一个式子
(dp[i][j] - dp[i][j]) - (dp[i][j-1] - dp[i][j-1])
cut=k cut=d cut=k cut=d
=(dp[i][j] + dp[i][j-1]) - (dp[i][j-1] + dp[i][j])
cut=k cut=d cut=k cut=d
=(dp[i][k]+dp[k+1][j]+cost[i][j]+dp[i][d]+dp[d+1][j-1]+cost[i][j-1])-(dp[i][k]+dp[k+1][j-1]+cost[i][j-1]+dp[i][d]+dp[d+1][j]+cost[i][j] )
=(dp[k+1][j]+dp[d+1][j-1])-(dp[k+1][j-1]+dp[d+1][j])
因为 k+1<=d+1 <=j-1< j,由四边形不等式可知
=dp[k+1][j]+dp[d+1][j-1] >= dp[k+1][j-1]+dp[d+1][j]
所以
(dp[i][j] - dp[i][j]) - (dp[i][j-1] - dp[i][j-1]) >= 0
cut=k cut=d cut=k cut=d
移一下项
(dp[i][j] - dp[i][j]) >= (dp[i][j-1] - dp[i][j-1])
cut=k cut=d cut=k cut=d
又因为d是dp[i][j-1]的最优分割点
所以
(dp[i][j-1] - dp[i][j-1]) >=0 (因为cut=d时dp[i][j-1]取最小值,cut取其他位置时得到的值必然大于在d点切割取的值)
cut=k cut=d
所以
(dp[i][j] - dp[i][j]) >=0
cut=k cut=d
又因为k是任意小于d的数(k<=d)
dp[i][j] >= dp[i][j]
cut=k cut=d
所以要想dp[i][j]最小,那么它的最优分割点s[i][j]必然大于等于d (d=s[i][j-1])
即 s[i][j] >= s[i][j-1]
证毕,同理可得
s[i][j] <= s[i+1][j]
有了s[i][j-1]<=s[i][j]<=s[i+1][j]这个结论
我们就可以把第三层for循环找最优分割点的区间从(i,j) 缩小到(s[i][j-1],s[i+1][j])
这样就把第三层for循环的时间复杂度从o(n)降到o(1)
从而把整个时间复杂度从o(n^3)降到o(n^2)。
本人因为知识有限,本博客的证明可能存在不正确的地方,欢迎大家加我的QQ给予指教。
qq:2465806616
参考博客: