HDU_1457_后缀自动机四·重复旋律7

#1457 : 后缀自动机四·重复旋律7

时间限制:15000ms
单点时限:3000ms
内存限制:512MB

描述

小Hi平时的一大兴趣爱好就是演奏钢琴。我们知道一段音乐旋律可以被表示为一段数构成的数列。

神奇的是小Hi发现了一部名字叫《十进制进行曲大全》的作品集,顾名思义,这部作品集里有许多作品,但是所有的作品有一个共同特征:只用了十个音符,所有的音符都表示成0-9的数字。

现在小Hi想知道这部作品中所有不同的旋律的“和”(也就是把串看成数字,在十进制下的求和,允许有前导0)。答案有可能很大,我们需要对(10^9 + 7)取摸。

解题方法提示

输入

第一行,一个整数N,表示有N部作品。

接下来N行,每行包含一个由数字0-9构成的字符串S。

所有字符串长度和不超过 1000000。

输出

共一行,一个整数,表示答案 mod (10^9 + 7)。

样例输入
2
101
09
样例输出
131
  • 给出n个数串然后求出所有数串中所有子数串的sum
  • 如果一个一个的字串来求就要造n个自动机
  • 至于计算过程就是对于每一个节点延伸到下一个节点过程中将当前sum乘10之后加上到下一个节点的单个数乘以当前字串出现次数的乘积即可
  • 那么这样的计算方式没有问题但是建立n个SAM耗时太长了
  • 那么我们可不可以减少SAM的建立呢?
  • 还是可以的,只要把全部的字串用“:”链接,之后再建立SAM即可
  • 在这里我们总的计算方式是不变的
  • 但是对于一个出现过“:”的字串是不应该进行计算的,因为如果出现“:”就代表着当前字串包含至少两个原始串
  • 所以我们现在的问题是怎样辨别当前字串中是否出现过“:”
  • 我们可以通过在字串出现次数这里做文章,对于字串中出现“:”的我们可以通过把字串出现次数标记为0,在进行计算的过程中我们相当于没有对于当前待操作节点sum进行更新即可。那么这里对于cnt的计算可以通过普通的拓扑排序进行,在排序过程中只对于0到9的的路径进行记录
  • 之后就是从根节点进行一次bfs即可
  • 我的代码里把以上的cnt的计算和计算最终结果的bfs合并在一起了,用一个拓扑解决了
 #include <iostream>
#include <string>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <climits>
#include <cmath>
#include <vector>
#include <queue>
#include <stack>
#include <set>
#include <map>
using namespace std;
typedef long long LL ;
typedef unsigned long long ULL ;
const int maxn = 1e6 + ;
const int inf = 0x3f3f3f3f ;
const int npos = - ;
const LL mod = 1e9 + ;
const int mxx = + ;
const double eps = 1e- ;
const double PI = acos(-1.0) ;
struct topo{
int len, st;
topo(int x, int y){
len=x; st=y;
}
};
bool topocmp(const topo &l, const topo &r){
return l.len<r.len;
}
struct SAM{
struct node{
int len;
int link, go[];
LL cnt, val;
};
node state[maxn<<];
int n, tot, root, last;
void init(char *str){
n=strlen(str);
tot=;
root=;
last=;
memset(&state,,sizeof(state));
state[root].cnt=1LL;
}
void extend(int w){
tot++;
int p=last;
int np=tot;
state[np].len=state[p].len+;
state[np].cnt=0LL;
// state[np].cnt=(w==10?1LL:0LL);
state[np].val=0LL;
while(p && state[p].go[w]==){
state[p].go[w]=np;
p=state[p].link;
}
if(p==){
state[np].link=root;
}else{
int q=state[p].go[w];
if(state[p].len+==state[q].len){
state[np].link=q;
}else{
tot++;
int nq=tot;
state[nq].len=state[p].len+;
state[nq].cnt=state[q].cnt;
state[nq].val=0LL;
memcpy(state[nq].go,state[q].go,sizeof(state[q].go));
state[nq].link=state[q].link;
state[q].link=nq;
state[np].link=nq;
while(p && state[p].go[w]==q){
state[p].go[w]=nq;
p=state[p].link;
}
}
}
last=np;
}
void build(char *str){
init(str);
for(int i=;i<n;i++)
extend(str[i]-'');
}
LL calsum(void){
LL ans=0LL;
std::vector< topo > v;
for(int i=root;i<=tot;i++)
v.push_back(topo(state[i].len,i));
sort(v.begin(),v.end(), topocmp);
int sz=v.size(), p, q;
for(int i=;i<sz;i++){
p=v[i].st;
for(int j=;j<;j++)
if(state[p].go[j]){
q=state[p].go[j];
state[q].cnt+=state[p].cnt;
state[q].val=(state[q].val + ((10LL*state[p].val)%mod + ((LL)j*state[p].cnt)%mod)%mod)%mod;
}
ans=(ans+state[p].val)%mod;
}
ans=(ans+mod)%mod;
return ans;
}
};
SAM A;
int n, lth;
char str[maxn];
int main(){
// freopen("in.txt","r",stdin);
// freopen("out.txt","w",stdout);
while(~scanf("%d",&n)){
lth=;
for(int i=;i<=n;i++,lth++){
scanf("%s",str+lth);
lth=strlen(str);
if(i==n){break;}
str[lth]=':';
}
A.build(str);
printf("%lld\n",A.calsum());
}
return ;
}
上一篇:我所了解的 京东、携程、eBay、小米 的 OpenStack 云


下一篇:hihocoder-1419 后缀数组四·重复旋律4 求连续重复次数最多的子串