Problem
Description
小 \(G\) 是一个出色的诗人,经常作诗自娱自乐。但是,他一直被一件事情所困扰,那就是诗的排版问题。
一首诗包含了若干个句子,对于一些连续的短句,可以将它们用空格隔开并放在一行中,注意一行中可以放的句子数目是没有限制的。小 \(G\) 给每首诗定义了一个行标准长度(行的长度为一行中符号的总个数),他希望排版后每行的长度都和行标准长度相差不远。显然排版时,不应改变原有的句子顺序,并且小 \(G\) 不允许把一个句子分在两行或者更多的行内。在满足上面两个条件的情况下,小 \(G\) 对于排版中的每行定义了一个不协调度, 为这行的实际长度与行标准长度差值绝对值的 \(P\) 次方,而一个排版的不协调度为所有行不协调度的总和。
小 \(G\) 最近又作了几首诗,现在请你对这首诗进行排版,使得排版后的诗尽量协调(即不协调度尽量小),并把排版的结果告诉他。
Input Format
输入文件中的第一行为一个整数 \(T\),表示诗的数量。
接下来为 \(T\) 首诗,这里一首诗即为一组测试数据。每组测试数据中的第一行为三个由空格分隔的正整数 \(N\),\(L\),\(P\),其中:\(N\) 表示这首诗句子的数目,\(L\) 表示这首诗的行标准长度,\(P\) 的含义见问题描述。
从第二行开始,每行为一个句子,句子由英文字母、数字、标点符号等符号组成(ASCII码33~127,但不包含'-')。
Output Format
于每组测试数据,若最小的不协调度不超过 \(10^{18}\) ,则第一行为一个数,表示不协调度。
\(Luogu\) 额外快乐:接下来若干行,表示你排版之后的诗。注意:在同一行的相邻两个句子之间需要用一个空格分开。如果有多个可行解,它们的不协调度都是最小值,则输出任意一个解均可。
若最小的不协调度超过 \(10^{18}\) ,则输出“\(Too\ hard\ to\ arrange\)”(不含引号)。每组测试数据结束后输出“--------------------”(不含引号),共20个“-”,“-”的ASCII码为45,请勿输出多余的空行或者空格。
Sample
Input
4
4 9 3
brysj,
hhrhl.
yqqlm,
gsycl.
4 9 2
brysj,
hhrhl.
yqqlm,
gsycl.
1 1005 6
poet
1 1004 6
poet
Output
108
brysj,
hhrhl.
yqqlm,
gsycl.
--------------------
32
brysj, hhrhl.
yqqlm, gsycl.
--------------------
Too hard to arrange
--------------------
1000000000000000000
poet
--------------------
Explanation
Explanatoin for Input
前两组输入数据中每行的实际长度均为6,后两组输入数据每行的实际长度均为4。一个排版方案中每行相邻两个句子之间的空格也算在这行的长度中(可参见样例中第二组数据)。每行末尾没有空格。
Range
测试点 | \(T\) | \(N\) | \(L\) | \(P\) |
---|---|---|---|---|
\(1\) | \(\le 10\) | \(\le18\) | \(\le100\) | \(\le5\) |
\(2\) | \(\le10\) | \(\le2000\) | \(\le60000\) | \(\le10\) |
\(3\) | \(\le10\) | \(\le2000\) | \(\le60000\) | \(\le10\) |
\(4\) | \(\le5\) | \(\le100000\) | \(\le200\) | \(\le10\) |
\(5\) | \(\le5\) | \(\le100000\) | \(\le200\) | \(\le10\) |
\(6\) | \(\le5\) | \(\le100000\) | \(\le3000000\) | \(2\) |
\(7\) | \(\le5\) | \(\le100000\) | \(\le3000000\) | \(2\) |
\(8\) | \(\le5\) | \(\le100000\) | \(\le3000000\) | \(\le10\) |
\(9\) | \(\le5\) | \(\le100000\) | \(\le3000000\) | \(\le10\) |
\(10\) | \(\le5\) | \(\le100000\) | \(\le3000000\) | \(\le10\) |
所有句子的长度不超过 \(30\) 。
Algorithm
\(DP\),决策单调性。
Mentality
我们发现数据范围不小不大,正好是 \(nlog\) 到 \(nlog^2\) 级别的。
先记录一个前缀和 \(q\) ,\(q[i]\) 表示句子 \(1-i\) 的长度总和,注意加上空格的长度。
首先观察到一个很显然的一维 \(dp\) ,\(f[i]\) 代表选到了第 \(i\) 个句子并且在此换行的最小不协调度,设 \(w(i,j)=abs(q[i]-q[j]-L-1)^P\) ,那么我们可以得到这样一个 \(n^2\) 的 \(dp\) :
\]
这确确实实是很简单的,但是很显然,复杂度过不了关。
那么考虑如何优化:
众所周知,\(dp\) 分为三个部分,枚举状态×枚举决策点×状态转移=时间复杂度。
我们考虑一一下手。
对于枚举状态的部分,由于必须顺着推过去,所以 \(O(n)\) 还是跑不了。
对于枚举决策点的部分,我们发现这个式子异常眼熟,一看就符合决策单调性的应用式。
对于状态转移的部分,\(O(1)\) 不能再优化了。
那么我们考虑如何利用决策单调性来优化这道题目。首先,对于一维 \(dp\) ,设 \(g[i]\) 为状态 \(i\) 的最优决策点,它的决策单调性的显著特征自然是:\(g[i-1]\le g[i]\) ,那么我们考虑利用这种决策单调性来做题。
我们利用队列记录下每个决策点 \(que\) ,并记录其对应下一个决策点左区间 \(L\) 。之所以这样做,是因为对于每个决策点,它对于每个区间的优劣性是不同的,所以它必定只会对一个区间最优。
但是这题之所以满足决策单调性,就是因为对于决策点而言,决策点位置的递增也意味着对应区间的递增,也就是说对于最右边的一段区间某个位置至位置 \(n\) ,最优决策点必定是最新的决策点。
对于这一点,我们可以有如下证明:
- 首先我们回到问题,我们已经选出了一些句子分好了行,在当前行我们还未换行。
- 不考虑下一行,那么如果还有句子加上当前的句子的长度小于标准长度,则一定要选,若长度之和大于标准长度,则只需要考虑选与不选。
- 所以,对于当前行的决策,我们只会浮动在两个左右的决策点之间,因为 \(w\) 函数的指数性递增决定了我们选择的单调性。
- 所以对于越往后的区间,它的最优决策点就越往后,因为 \(w\) 函数过大会造成 \(dp\) 的变劣。
那么我们的 \(dp\) 就分为了如下几个过程,设当前 \(dp[i]\) 正被更新:
- 1、找到对应 \(i\) 的决策点区间,如果队首不符合就 \(head++\) ,直到当前队首决策点的对应区间包括 \(i\) 。
- 2、\(f[i]=f[que[head]]+work(que[head],i)\) ,通过队首的决策点来转移。
- 3、通过二分寻找出最左边的,以队尾决策点为决策点不如以 \(i\) 为决策点更优的位置,由于单调变优性,从这个位置往右的 \(dp\) 都满足以 \(i\) 为决策点是目前最优的。如果这个最左边的位置要小于队尾决策点对应的左区间,那么说明对于这个决策点对应的所有转移都不如 \(i\) 更优,所以弹出队尾,我们继续判断新的队尾与 \(i\) 的决策。
- 4、当队尾的弹出停止的时候,我们二分出的位置往右的 \(dp\) 都以 \(i\) 决策最优,那么把当前队尾的决策区间右端点改为这个位置,\(q[++tail]=i\) 将 \(i\) 入队,且 \(i\) 的对应区间右端点为 \(n\) 。
不过需要注意,我们应用 \(long\ double\) 存下 \(dp\) 值,因为如果 \(dp\) 值大于 \(1e18\) 就不能用 \(long\ long\) 存了,但是用 \(long\ double\) 还是可以比较大小。科学计数法好。
完成!
Code
#include <cmath>
#include <cstdio>
#include <cstring>
#include <iostream>
using namespace std;
int head, tail, T, n, len, P, q[100001], g[100001], L[100001], que[100001];
char s[100002][31];
long double f[100001];
long double ksm(long double x) {
int base = P;
long double a = 1;
while (base) {
if (base & 1) a = a * x;
x = x * x;
base >>= 1;
}
return a;
} //快速幂
long double work(int i, int j) {
return f[j] + ksm((long double)abs(q[i] - q[j] - 1 - len));
} //计算以 j 为决策点 i 将得到的状态转移值
int find(int x, int y) {
int l = x, r = n + 1;
while (l < r) {
int mid = (l + r) >> 1;
work(mid, x) >= work(mid, y) ? r = mid : l = mid + 1;
}
return l;
} //查找 i 的最左最优决策位置
int main() {
cin >> T;
while (T--) {
cin >> n >> len >> P;
for (int i = 1; i <= n; i++) {
q[i] = 0;
scanf("%s", s[i]);
q[i] = strlen(s[i]) + q[i - 1] + 1; //单词长度前缀和
}
que[head = tail = 1] = 0; //初始化决策点队列
for (int i = 1; i <= n; i++) {
while (head < tail && L[head] <= i) //先找到对应区间包含 i 的位置,L
//记录的是下一个决策区间的左端点
head++;
g[i] = que[head];
f[i] = work(i, g[i]); //更新 dp 值
while (head < tail && L[tail - 1] >= find(que[tail], i)) //进行队尾判断
tail--;
L[tail] = find(que[tail], i); //更新队尾区间
que[++tail] = i; //决策点入队
}
if (f[n] > 1e18)
puts("Too hard to arrange");
else {
printf("%lld\n", (long long)f[n]);
int top = 0;
for (int i = n; i; i = g[i]) q[++top] = g[i];
q[0] = n;
while (top--) {
int L = q[top + 1] + 1, R = q[top];
for (int i = L; i < R; i++) printf("%s ", s[i]);
puts(s[R]); //行末不能有空格
}
}
puts("--------------------");
}
cout << endl;
}