$f[i][k]$ 表示前 $i$ 个分成 $k$ 段,且最后一段以 $i$ 结尾的最小值
容易写出转移方程 $f[i][k] = \min \{f[j][k - 1] + calc(j+1,i)\}$
因为具有决策单调性(打表 or 证明(不会)),就可以一种分治算法来优化
具体实现就是 $solve(l,r,L,R)$ 表示要求出 $(l,r)$ 之间的 dp 值,而决策点能取的区间为 $[L,R]$
先暴力求出 $mid=\dfrac{l+r}{2}$ 的决策点 $pos$,再调用 $solve(l,mid-1,L,pos)$,$solve(mid+1,r,pos,R)$ 即可。
$calc(i,j)$ 就是求区间逆序对,用莫队,拓展时用树状数组即可。
#include <bits/stdc++.h> #define ll long long const int N = 4e4 + 7; const ll inf = 0x3f3f3f3f3f3f3f3f; ll dp[2][N], sum; int cnt[N], n, k, l = 1, r, cur, last, a[N]; struct Bit { int tree[N]; inline int lowbit(int x) { return x & -x; } void add(int x, int v) { if (x <= 0) return; for (int i = x; i <= n; i += lowbit(i)) tree[i] += v; } int query(int x) { if (x <= 0) return 0; int ans = 0; for (int i = x; i; i -= lowbit(i)) ans += tree[i]; return ans; } } bit; void calc(int x, int y) { while (l < x) { sum -= bit.query(a[l] - 1); bit.add(a[l++], -1); } while (l > x) { l--; sum += bit.query(a[l] - 1); bit.add(a[l], 1); } while (r > y) { sum -= bit.query(n) - bit.query(a[r]); bit.add(a[r--], -1); } while (r < y) { ++r; sum += bit.query(n) - bit.query(a[r]); bit.add(a[r], 1); } } void solve(int l, int r, int L, int R) { if (l > r) return; int mid = l + r >> 1; dp[cur][mid] = inf; int pos = 0; for (int i = L; i <= std::min(mid, R); i++) { calc(i, mid); if (dp[cur][mid] > dp[last][i - 1] + sum) dp[cur][mid] = dp[last][i - 1] + sum, pos = i; } solve(l, mid - 1, L, pos); solve(mid + 1, r, pos, R); } int main() { scanf("%d%d", &n, &k); for (int i = 1; i <= n; i++) scanf("%d", a + i); memset(dp, 0x3f, sizeof(dp)); dp[0][0] = 0; last = 0; cur = 1; while (k--) { solve(1, n, 1, n); std::swap(cur, last); } printf("%lld\n", dp[last][n]); return 0; }View Code