【NOI 2009】诗人小G

Problem

Description

小 \(G\) 是一个出色的诗人,经常作诗自娱自乐。但是,他一直被一件事情所困扰,那就是诗的排版问题。

一首诗包含了若干个句子,对于一些连续的短句,可以将它们用空格隔开并放在一行中,注意一行中可以放的句子数目是没有限制的。小 \(G\) 给每首诗定义了一个行标准长度(行的长度为一行中符号的总个数),他希望排版后每行的长度都和行标准长度相差不远。显然排版时,不应改变原有的句子顺序,并且小 \(G\) 不允许把一个句子分在两行或者更多的行内。在满足上面两个条件的情况下,小 \(G\) 对于排版中的每行定义了一个不协调度, 为这行的实际长度与行标准长度差值绝对值的 \(P\) 次方,而一个排版的不协调度为所有行不协调度的总和。

小 \(G\) 最近又作了几首诗,现在请你对这首诗进行排版,使得排版后的诗尽量协调(即不协调度尽量小),并把排版的结果告诉他。

Input Format

输入文件中的第一行为一个整数 \(T\),表示诗的数量。

接下来为 \(T\) 首诗,这里一首诗即为一组测试数据。每组测试数据中的第一行为三个由空格分隔的正整数 \(N\),\(L\),\(P\),其中:\(N\) 表示这首诗句子的数目,\(L\) 表示这首诗的行标准长度,\(P\) 的含义见问题描述。

从第二行开始,每行为一个句子,句子由英文字母、数字、标点符号等符号组成(ASCII码33~127,但不包含'-')。

Output Format

于每组测试数据,若最小的不协调度不超过 \(10^{18}\) ,则第一行为一个数,表示不协调度。

\(Luogu\) 额外快乐:接下来若干行,表示你排版之后的诗。注意:在同一行的相邻两个句子之间需要用一个空格分开。如果有多个可行解,它们的不协调度都是最小值,则输出任意一个解均可。

若最小的不协调度超过 \(10^{18}\) ,则输出“\(Too\ hard\ to\ arrange\)”(不含引号)。每组测试数据结束后输出“--------------------”(不含引号),共20个“-”,“-”的ASCII码为45,请勿输出多余的空行或者空格。

Sample

Input

4
4 9 3
brysj,
hhrhl.
yqqlm,
gsycl.
4 9 2
brysj,
hhrhl.
yqqlm,
gsycl.
1 1005 6
poet
1 1004 6
poet

Output

108
brysj,
hhrhl.
yqqlm,
gsycl.
--------------------
32
brysj, hhrhl.
yqqlm, gsycl.
--------------------
Too hard to arrange
--------------------
1000000000000000000
poet
--------------------

Explanation

Explanatoin for Input

前两组输入数据中每行的实际长度均为6,后两组输入数据每行的实际长度均为4。一个排版方案中每行相邻两个句子之间的空格也算在这行的长度中(可参见样例中第二组数据)。每行末尾没有空格。

Range

测试点 \(T\) \(N\) \(L\) \(P\)
\(1\) \(\le 10\) \(\le18\) \(\le100\) \(\le5\)
\(2\) \(\le10\) \(\le2000\) \(\le60000\) \(\le10\)
\(3\) \(\le10\) \(\le2000\) \(\le60000\) \(\le10\)
\(4\) \(\le5\) \(\le100000\) \(\le200\) \(\le10\)
\(5\) \(\le5\) \(\le100000\) \(\le200\) \(\le10\)
\(6\) \(\le5\) \(\le100000\) \(\le3000000\) \(2\)
\(7\) \(\le5\) \(\le100000\) \(\le3000000\) \(2\)
\(8\) \(\le5\) \(\le100000\) \(\le3000000\) \(\le10\)
\(9\) \(\le5\) \(\le100000\) \(\le3000000\) \(\le10\)
\(10\) \(\le5\) \(\le100000\) \(\le3000000\) \(\le10\)

所有句子的长度不超过 \(30\) 。

Algorithm

\(DP\),决策单调性。

Mentality

我们发现数据范围不小不大,正好是 \(nlog\) 到 \(nlog^2\) 级别的。

先记录一个前缀和 \(q\) ,\(q[i]\) 表示句子 \(1-i\) 的长度总和,注意加上空格的长度。

首先观察到一个很显然的一维 \(dp\) ,\(f[i]\) 代表选到了第 \(i\) 个句子并且在此换行的最小不协调度,设 \(w(i,j)=abs(q[i]-q[j]-L-1)^P\) ,那么我们可以得到这样一个 \(n^2\) 的 \(dp\) :

\[f[i]=Min_{j<i}(f[j]+w(i,j))
\]

这确确实实是很简单的,但是很显然,复杂度过不了关。

那么考虑如何优化:

众所周知,\(dp\) 分为三个部分,枚举状态×枚举决策点×状态转移=时间复杂度。

我们考虑一一下手。

对于枚举状态的部分,由于必须顺着推过去,所以 \(O(n)\) 还是跑不了。

对于枚举决策点的部分,我们发现这个式子异常眼熟,一看就符合决策单调性的应用式。

对于状态转移的部分,\(O(1)\) 不能再优化了。

那么我们考虑如何利用决策单调性来优化这道题目。首先,对于一维 \(dp\) ,设 \(g[i]\) 为状态 \(i\) 的最优决策点,它的决策单调性的显著特征自然是:\(g[i-1]\le g[i]\) ,那么我们考虑利用这种决策单调性来做题。

我们利用队列记录下每个决策点 \(que\) ,并记录其对应下一个决策点左区间 \(L\) 。之所以这样做,是因为对于每个决策点,它对于每个区间的优劣性是不同的,所以它必定只会对一个区间最优。

但是这题之所以满足决策单调性,就是因为对于决策点而言,决策点位置的递增也意味着对应区间的递增,也就是说对于最右边的一段区间某个位置至位置 \(n\) ,最优决策点必定是最新的决策点。

对于这一点,我们可以有如下证明:

  • 首先我们回到问题,我们已经选出了一些句子分好了行,在当前行我们还未换行。
  • 不考虑下一行,那么如果还有句子加上当前的句子的长度小于标准长度,则一定要选,若长度之和大于标准长度,则只需要考虑选与不选。
  • 所以,对于当前行的决策,我们只会浮动在两个左右的决策点之间,因为 \(w\) 函数的指数性递增决定了我们选择的单调性。
  • 所以对于越往后的区间,它的最优决策点就越往后,因为 \(w\) 函数过大会造成 \(dp\) 的变劣。

那么我们的 \(dp\) 就分为了如下几个过程,设当前 \(dp[i]\) 正被更新:

  • 1、找到对应 \(i\) 的决策点区间,如果队首不符合就 \(head++\) ,直到当前队首决策点的对应区间包括 \(i\) 。
  • 2、\(f[i]=f[que[head]]+work(que[head],i)\) ,通过队首的决策点来转移。
  • 3、通过二分寻找出最左边的,以队尾决策点为决策点不如以 \(i\) 为决策点更优的位置,由于单调变优性,从这个位置往右的 \(dp\) 都满足以 \(i\) 为决策点是目前最优的。如果这个最左边的位置要小于队尾决策点对应的左区间,那么说明对于这个决策点对应的所有转移都不如 \(i\) 更优,所以弹出队尾,我们继续判断新的队尾与 \(i\) 的决策。
  • 4、当队尾的弹出停止的时候,我们二分出的位置往右的 \(dp\) 都以 \(i\) 决策最优,那么把当前队尾的决策区间右端点改为这个位置,\(q[++tail]=i\) 将 \(i\) 入队,且 \(i\) 的对应区间右端点为 \(n\) 。

不过需要注意,我们应用 \(long\ double\) 存下 \(dp\) 值,因为如果 \(dp\) 值大于 \(1e18\) 就不能用 \(long\ long\) 存了,但是用 \(long\ double\) 还是可以比较大小。科学计数法好。

完成!

Code

#include <cmath>
#include <cstdio>
#include <cstring>
#include <iostream>
using namespace std;
int head, tail, T, n, len, P, q[100001], g[100001], L[100001], que[100001];
char s[100002][31];
long double f[100001];
long double ksm(long double x) {
int base = P;
long double a = 1;
while (base) {
if (base & 1) a = a * x;
x = x * x;
base >>= 1;
}
return a;
} //快速幂
long double work(int i, int j) {
return f[j] + ksm((long double)abs(q[i] - q[j] - 1 - len));
} //计算以 j 为决策点 i 将得到的状态转移值
int find(int x, int y) {
int l = x, r = n + 1;
while (l < r) {
int mid = (l + r) >> 1;
work(mid, x) >= work(mid, y) ? r = mid : l = mid + 1;
}
return l;
} //查找 i 的最左最优决策位置
int main() {
cin >> T;
while (T--) {
cin >> n >> len >> P;
for (int i = 1; i <= n; i++) {
q[i] = 0;
scanf("%s", s[i]);
q[i] = strlen(s[i]) + q[i - 1] + 1; //单词长度前缀和
}
que[head = tail = 1] = 0; //初始化决策点队列
for (int i = 1; i <= n; i++) {
while (head < tail && L[head] <= i) //先找到对应区间包含 i 的位置,L
//记录的是下一个决策区间的左端点
head++;
g[i] = que[head];
f[i] = work(i, g[i]); //更新 dp 值
while (head < tail && L[tail - 1] >= find(que[tail], i)) //进行队尾判断
tail--;
L[tail] = find(que[tail], i); //更新队尾区间
que[++tail] = i; //决策点入队
}
if (f[n] > 1e18)
puts("Too hard to arrange");
else {
printf("%lld\n", (long long)f[n]);
int top = 0;
for (int i = n; i; i = g[i]) q[++top] = g[i];
q[0] = n;
while (top--) {
int L = q[top + 1] + 1, R = q[top];
for (int i = L; i < R; i++) printf("%s ", s[i]);
puts(s[R]); //行末不能有空格
}
}
puts("--------------------");
}
cout << endl;
}
上一篇:Account Team使用说明


下一篇:ActiveMQ(3)---ActiveMQ原理分析之消息持久化