题目链接:http://poj.org/problem?id=1743
题意:有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:
1、长度至少为5个音符。
2、在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)
3、重复出现的同一主题不能有公共部分。
思路:后缀数组。求出任意相邻音符的差值,然后把问题转化为不可重叠最长重复子串,用后缀数组来做。先二分答案,把题目变成判定性问题:判断是否存在两个长度为k的子串是相同的,且不重叠。
先不考虑重叠,重复子串的长度要大于等于k,也就是一个区间内的height值都大于等于k,当出现height小于k则重新定位。
再来考虑重叠,我们知道了一个区间的height都大于等于k,如果存在两个后缀距离大于k,那么可以肯定存在两个长度为k的子串是相同的,且不重叠。
#include <cstdio>
const int MAXN = ;
int wa[MAXN], wb[MAXN], wv[MAXN], ws[MAXN]; int cmp(int* r, int a, int b, int l)
{
return r[a] == r[b] && r[a + l] == r[b + l];
} /*
* r: 原字符串 放在0 - (n-1)位在最后补一个最小字符(ASCLL最小)
* sa: 后缀数组 sa[1...n]有效 sa[0]无效
* n: 原字符串长度 + 1(后面补了一个字符)
* m: 字符大小(ASCLL)的上界
*/
void Da(int* r, int* sa, int n, int m)
{
int i, j, p, *x = wa, *y = wb, *t; for (i = ; i < m; ++i) ws[i] = ;
for (i = ; i < n; ++i) ++ws[x[i] = r[i]];
for (i = ; i < m; ++i) ws[i] += ws[i - ];
for (i = n - ; i >= ; --i) sa[--ws[x[i]]] = i; for (j = , p = ; p < n; j *= , m = p)
{
for (p = , i = n - j; i < n; ++i) y[p++] = i;
for (i = ; i < n; ++i)
{
if (sa[i] >= j)
y[p++] = sa[i] - j;
} for (i = ; i < n; ++i) wv[i] = x[y[i]];
for (i = ; i < m; ++i) ws[i] = ;
for (i = ; i < n; ++i) ++ws[wv[i]];
for (i = ; i < m; ++i) ws[i] += ws[i - ];
for (i = n - ; i >= ; --i) sa[--ws[wv[i]]] = y[i]; t = x;
x = y;
y = t;
x[sa[]] = ; for (p = , i = ; i < n; ++i)
{
x[sa[i]] = cmp(y, sa[i - ], sa[i], j) ? p - : p++;
}
}
return;
} int rank[MAXN];
int height[MAXN];
/*
* rank: 名次数组(后缀i在所有后缀中从小到大排列的名次),(以第k个字符开始的后缀称为后缀k)rank[0...n-1]有效
* height: height[i] = suffix(sa[i - 1])和suffix(sa[i])的最长公共前缀,也就是排名相邻的两个后缀的最长公共前缀。height[2...n]有效
*/
void CalHeight(int* r, int* sa, int n)
{
int i, j, k = ;
for (i = ; i <= n; ++i) rank[sa[i]] = i;
for (i = ; i < n; height[rank[i++]] = k)
for (k ? k-- : , j = sa[rank[i] - ]; r[i + k] == r[j + k]; ++k);
return;
} bool IsExist(int sa[], int n, int key)
{
int tMax = sa[];
int tMin = sa[];
for (int i = ; i <= n; ++i)
{
if (height[i] < key) tMax = tMin = sa[i];
else
{
if (sa[i] < tMin) tMin = sa[i];
if (sa[i] > tMax) tMax = sa[i];
if (tMax - tMin > key) return true;
}
}
return false;
} int r[MAXN], sa[MAXN]; int main()
{
int n;
while (scanf("%d", &n), n)
{
--n;
int k, t;
scanf("%d", &t);
for (int i = ; i < n; ++i)
{
scanf("%d", &k);
r[i] = k - t + ;
t = k;
}
r[n] = ;
Da(r, sa, n + , );
CalHeight(r, sa, n);
int tMin = 4; // 子串最小的长度为4
int tMax = n / ; // 要满足不重叠重复,那么该子串的长度最长为一半
int tMid;
while (tMin <= tMax)
{
tMid = (tMin + tMax) / ;
if (IsExist(sa, n, tMid)) tMin = tMid + ;
else tMax = tMid - ;
}
if (tMax >= ) printf("%d\n", tMax + );
else printf("0\n");
}
return ;
}