学习笔记:舞蹈链 Dancing Links

这是一种奇妙的算法用来解决两个问题:

  1. 精确覆盖问题:给定一个矩阵,每行是一个二进制数,选出尽量少的行,使得每一列恰好有一个 \(1\)
  2. 重复覆盖问题:给定一个矩阵,每行是一个二进制数,选出尽量少的行,使得每列至少有一个 \(1\)。

模板一般需要有两个:① 数据结构(十字链表)② dfs 框架

其中 ① 对于两个问题都是一样的,而 ② 不同问题不同框架。

精确覆盖问题

1. 如何存储这个矩阵:十字链表

由于 \(0\) 的信息冗余,我们只存 \(1\),不存 \(0\),复杂度可以做到和 \(1\) 的个数相关,这样就处理掉了那种稀疏图(行列很大,但 \(1\) 的个数很少的情况)。

十字链表 QWQ

  1. 对于所有 \(1\) 的位置建立节点。

  2. 看一下每个节点上下左右应该连向谁,这里十字链表是一个循环链表。举个例子,如果 \((x, y)\) 上面没有节点,那么循环到最底下,然后再往上走,直到走到第一个 \(1\)。

实际到代码实现,我们可以按行创建:

  1. 预备信息
const int N = 具体问题中 1 最多的点数。
int n, m, U[N], D[N], L[N], R[N], idx, s[N], hh, tt, X[N], Y[N];
/*
n 为行数,m 为列数,U/D/L/R[i] 分别表示 i 节点上下左右的节点。
idx 为当前用了的点数, s[i] 表示第 i 列为 1 的有多少行。
hh, tt 用于加入点时两个端点。
X[i], Y[i] 表示 i 号点的 x, y 坐标
*/
  1. 首先第一行是哨兵(全 \(1\)),并且 \((0, 0)\) 加入一个节点以便后续快速找到现在还有多少个 \(1\)。
void inline init() {
for (int i = 0; i <= m; i++)
L[i] = i - 1, R[i] = i + 1, U[i] = D[i] = i;
L[0] = m, R[m] = 0, idx = m;
}
  1. 每一次加入一行。然后考虑左右两个点 \(hh, tt\),每次动态把一个 \(1\) 插入到 \(hh, tt\) 之间。
void inline add(int x, int y) {
X[++idx] = x, Y[idx] = y, s[y]++;
L[idx] = hh, R[idx] = tt, L[tt] = R[hh] = idx;
U[idx] = U[y], D[idx] = y, D[U[y]] = idx, U[y] = idx;
// 注意 U[y] = idx 必须在最后,因为其他东西需要用到之前的 U[y],即 idx 上面那个店。
hh = idx;
}
// 读入 n * m 的矩阵并按行加入
for (int i = 1; i <= n; i++) {
hh = idx + 1, tt = idx + 1; // 可以理解为第一行第一个点左右都是自己。
for (int j = 1, x; j <= m; j++) {
scanf("%d", &x);
if (x) add(i, j); // 如果 i, j 为 1,加入 (i, j)
}
}

按行插入有趣的是,你只需要把它搞成一个循环链表就行了,甚至你随便左右的顺序也是可以过的,只要保持在同一行循环链表的性质就可以。

for (int i = 1; i <= n; i++) {
hh = idx + 1, tt = idx + 1;
len = 0;
for (int j = 1, x; j <= m; j++) {
scanf("%d", &x);
if (x) d[++len] = j;
}
random_shuffle(d + 1, d + 1 + len); // 233
for (int j = 1; j <= len; j++) add(i, d[j]);
}

QAQ

  1. 删除第 \(p\) 列及其关联的所有行。删除列的时候,只需要删除第一行对应的列,原因在于我们 dfs 时找是通过第一行的哨兵找;删除行的时候,只需要把行对应列的位置删掉(这列的 \(s\) 信息就不管了,反正以后也不用了),行相互作用是不需要删的,原因是不影响,且我们需要用行的信息恢复现场.jpg
void del(int p) {
L[R[p]] = L[p], R[L[p]] = R[p];
for (int i = D[p]; i != p; i = D[i]) {
for (int j = R[i]; j != i; j = R[j]) {
s[Y[j]]--, U[D[j]] = U[j], D[U[j]] = D[j];
}
}
}
  1. 按插入顺序撤销第 \(p\) 列,注意这里按照时间逆序操作即可,相互不影响的时间顺序可以改变。
void resume(int p) {
L[R[p]] = p, R[L[p]] = p;
for (int i = U[p]; i != p; i = U[i]) {
for (int j = L[i]; j != i; j = L[j]) {
s[Y[j]]++, U[D[j]] = j, D[U[j]] = j;
}
}
}

2. dfs 框架:针对精确覆盖问题。

每次任意选择未被选择的一行,判断能不能选。

剪枝:

  1. 挑 \(1\) 的个数最少的列。枚举这一列选哪个行。如果我们选择了这一列,接下来就不需要考虑这一列的影响了,所以我们可以把这一列删掉(十字链表的操作)。
  2. 选择一行,实际上是把这行所有 \(1\) 的列都选了,即删掉这些列,然后这些列关系到的行也都没了,把这些行也干掉,禁止套娃。有些人可能认为这会造成无休止的删,但实际上只会影响两次,为什么能,即选择一行 \(\Rightarrow\) 删掉对应列 \(\Rightarrow\) 废掉对应列的行,废掉和选择是不一样的,废掉就不会影响其他列了。

经过这两步,我们可以理解为,\(dfs\) 到当前的数据结构上都是没选的列和行,相当于每次选一行把问题转化成了更小规模,即选择一行,把与这行冲突的行删掉,并且删掉对应列,通过十字链表,我们做到了快速删除/查找。

bool inline dfs() {
if (!R[0]) return true;
int p = R[0];
for (int i = R[0]; i; i = R[i])
if (s[i] < s[p]) p = i;
if (!s[p]) return false;
del(p);
for (int i = D[p]; i != p; i = D[i]) {
ans[++top] = X[i];
for (int j = R[i]; j != i; j = R[j]) del(Y[j]);
if (dfs()) return true;
for (int j = L[i]; j != i; j = L[j]) resume(Y[j]);
--top;
}
resume(p);
return false;
}

时间复杂度

约为 \(O(c ^ n)\),其中 \(c\) 是一个接近 \(1\) 的常数,\(n\) 为矩阵中 \(1\) 的个数。随机数据的话 \(n\) 到上万级别也没啥问题。(又是一个玄学复杂度的算法)。

例题

题目 \(\Rightarrow\) 模型的转化,可以把每一个决策当成一行,限制当成一列,如果一个限制恰好一次那么就可以精确覆盖。

模板题

#include <iostream>
#include <cstdio> using namespace std; const int N = 5505, M = 505; int n, m, U[N], D[N], L[N], R[N], idx, s[N], hh, tt, X[N], Y[N]; int ans[M], top; void inline init() {
for (int i = 0; i <= m; i++)
L[i] = i - 1, R[i] = i + 1, U[i] = D[i] = i;
L[0] = m, R[m] = 0, idx = m;
} void inline add(int x, int y) {
X[++idx] = x, Y[idx] = y, s[y]++;
L[idx] = hh, R[idx] = tt, L[tt] = R[hh] = idx;
U[idx] = U[y], D[idx] = y, D[U[y]] = idx, U[y] = idx;
hh = idx;
} // 删除第 p 列 void del(int p) {
L[R[p]] = L[p], R[L[p]] = R[p];
for (int i = D[p]; i != p; i = D[i]) {
for (int j = R[i]; j != i; j = R[j]) {
s[Y[j]]--, U[D[j]] = U[j], D[U[j]] = D[j];
}
}
} void resume(int p) {
L[R[p]] = p, R[L[p]] = p;
for (int i = U[p]; i != p; i = U[i]) {
for (int j = L[i]; j != i; j = L[j]) {
s[Y[j]]++, U[D[j]] = j, D[U[j]] = j;
}
}
} bool inline dfs() {
if (!R[0]) return true;
int p = R[0];
for (int i = R[0]; i; i = R[i])
if (s[i] < s[p]) p = i;
if (!s[p]) return false;
del(p);
for (int i = D[p]; i != p; i = D[i]) {
ans[++top] = X[i];
for (int j = R[i]; j != i; j = R[j]) del(Y[j]);
if (dfs()) return true;
for (int j = L[i]; j != i; j = L[j]) resume(Y[j]);
--top;
}
resume(p);
return false;
} int main() {
scanf("%d%d", &n, &m);
init();
for (int i = 1; i <= n; i++) {
hh = idx + 1, tt = idx + 1;
for (int j = 1, x; j <= m; j++) {
scanf("%d", &x);
if (x) add(i, j);
}
}
if (!dfs()) puts("No Solution!");
else for (int i = 1; i <= top; i++) printf("%d ", ans[i]);
return 0;
}

16 * 16 数独

行数:设空出的格子有 \(n\) 个,那么每个格子可以填 \(16\) 个字母,共 \(n * 16\) 行(决策)。

列数:即限制,每个格子恰好一个数字 \(n+\) 每行每列每个十六宫格每个数都出现恰好一次 \(3n\) \(= 4n\)

每行恰好 \(4\) 个 \(1\),即格子的位置 \(1\),行列十六宫格位置 \(1\)。

这样总点数是 \(n \times 64 \le 16384\) 个格子,这题暴力强剪枝可过,所以 Dacing Links 显然也能过。

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std; const int N = 17, S = 4, P = 16385, M = N * N * N; int n, m, U[P], D[P], L[P], R[P], X[P], Y[P], s[P];
int idx, ans[M], top, tot, hh, tt;
// 各自限制的状态编号 bool st[N]; char a[N][N]; struct Selection{
int x, y;
char c;
} e[M]; void inline clear() {
n = idx = tot = top = 0, m = 1024;
memset(s, 0, sizeof s);
} void init() {
for (int i = 0; i <= m; i++)
L[i] = i - 1, R[i] = i + 1, U[i] = D[i] = i;
L[0] = m, R[m] = 0, idx = m;
} void inline add(int x, int y) {
X[++idx] = x, Y[idx] = y, s[y]++;
L[idx] = hh, R[idx] = tt, R[hh] = L[tt] = idx;
U[idx] = U[y], D[idx] = y, D[U[y]] = idx, U[y] = idx;
tt = idx;
} void del(int p) {
L[R[p]] = L[p], R[L[p]] = R[p];
for (int i = U[p]; i != p; i = U[i]) {
for (int j = R[i]; j != i; j = R[j]) {
s[Y[j]]--, D[U[j]] = D[j], U[D[j]] = U[j];
}
}
} void resume(int p) {
L[R[p]] = p, R[L[p]] = p;
for (int i = D[p]; i != p; i = D[i]) {
for (int j = L[i]; j != i; j = L[j]) {
s[Y[j]]++, D[U[j]] = j, U[D[j]] = j;
}
}
} bool dfs() {
if (!R[0]) return true;
int p = R[0];
for (int i = R[0]; i; i = R[i])
if (s[i] < s[p]) p = i;
if (!s[p]) return false;
del(p);
for (int i = U[p]; i != p; i = U[i]) {
ans[++top] = X[i];
for (int j = R[i]; j != i; j = R[j]) del(Y[j]);
if (dfs()) return true;
for (int j = L[i]; j != i; j = L[j]) resume(Y[j]);
top--;
}
resume(p);
return false;
} int main() {
while (~scanf("%s", a[0])) {
clear();
for (int i = 1; i <= 15; i++) scanf("%s", a[i]);
// 把限制总状态数抠出来
init();
for (int i = 0; i < 16; i++) {
for (int j = 0; j < 16; j++) {
int l = 0, r = 15;
if (a[i][j] != '-') l = r = a[i][j] - 'A';
for (int k = l; k <= r; k++) {
hh = idx + 1, tt = idx + 1;
e[++n] = (Selection) { i, j, (char)(k + 'A') } ;
add(n, (j + 1) + i * 16), add(n, 16 * 16 + i * 16 + k + 1);
add(n, 16 * 32 + j * 16 + k + 1), add(n, 16 * 48 + (i / 4 * 4 + j / 4) * 16 + k + 1);
}
}
}
dfs();
for (int i = 1; i <= top; i++)
a[e[ans[i]].x][e[ans[i]].y] = e[ans[i]].c;
for (int i = 0; i < 16; i++) printf("%s\n", a[i]);
puts("");
}
return 0;
}

重复覆盖问题

基本搜索框架:IDA*,层数不能太多)

跟精确覆盖问题的区别就是,考虑选择一行,只会把它关联的所有列删掉,并不会套娃删行,这是因为同一列下 \(1\) 的行同时选并不冲突。

但这样会慢很多,需要加一个 IDA*。

估价函数是:

  • 枚举没选的列,选上所有的行,股价函数 \(+1\)

这种方法可以看作把这列的所有行并起来算成一个行了,这个东西经过大量经验表明整挺快。

注意,这里删的时候是把对应列在在那些行里删掉。

#include <iostream>
#include <cstdio>
#include <cstring> using namespace std; const int N = 10005, M = 505; int n, m, U[N], D[N], L[N], R[N], idx, s[N], hh, tt, X[N], Y[N]; int ans[M], top, dep, d[M]; bool st[N]; void inline init() {
for (int i = 0; i <= m; i++)
L[i] = i - 1, R[i] = i + 1, U[i] = D[i] = i;
L[0] = m, R[m] = 0, idx = m;
} void inline add(int x, int y) {
X[++idx] = x, Y[idx] = y, s[y]++;
L[idx] = hh, R[idx] = tt, L[tt] = R[hh] = idx;
U[idx] = U[y], D[idx] = y, D[U[y]] = idx, U[y] = idx;
hh = idx;
} // 删除第 p 列 void inline del(int p) {
for (int i = D[p]; i != p; i = D[i])
L[R[i]] = L[i], R[L[i]] = R[i];
} void resume(int p) {
for (int i = U[p]; i != p; i = U[i])
L[R[i]] = i, R[L[i]] = i;
} int inline h() {
memset(st, false, sizeof st);
int cnt = 0;
for (int i = R[0]; i; i = R[i]) {
if (st[i]) continue;
cnt++;
for (int j = D[i]; j != i; j = D[j])
for (int k = R[j]; k != j; k = R[k]) st[Y[k]] = true;
}
return cnt;
} bool inline dfs() {
if (top + h() > dep) return false;
if (!R[0]) return true;
int p = R[0];
for (int i = R[0]; i; i = R[i])
if (s[i] < s[p]) p = i;
if (!s[p]) return false;
for (int i = D[p]; i != p; i = D[i]) {
ans[++top] = X[i];
del(i);
for (int j = R[i]; j != i; j = R[j]) del(j);
if (dfs()) return true;
for (int j = L[i]; j != i; j = L[j]) resume(j);
resume(i);
--top;
}
return false;
} int main() {
scanf("%d%d", &n, &m);
init();
for (int i = 1; i <= n; i++) {
hh = idx + 1, tt = idx + 1;
for (int j = 1, x; j <= m; j++) {
scanf("%d", &x);
if (x) add(i, j);
}
}
dep = 1;
while(!dfs()) dep++;
printf("%d\n", dep);
for (int i = 1; i <= dep; i++) printf("%d ", ans[i]);
return 0;
}
上一篇:SHA-256算法和区块链原理初探


下一篇:转载 - 跳跃的舞者,舞蹈链(Dancing Links)算法——求解精确覆盖问题