BZOJ1212[HNOI2004]L语言——trie树+DP

题目描述

标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。 一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。 我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若*分,且每一个部分都是字典D中的单词。 例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的 因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’ 在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解 而且是在字典D下能够被理解的最长的前缀。 给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。 并给出其在字典D下能够被理解的最长前缀的位置。

输入

输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。 之后的n行每行描述一个单词,再之后的m行每行描述一段文章。 其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。

输出

对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。

样例输入

4 3
is
name
what
your
whatisyourname
whatisyouname
whaisyourname

样例输出

14
6
0
整段文章’whatisyourname’都能被理解
前缀’whatis’能够被理解
没有任何前缀能够被理解
 
首先这道题并不是把每段文章在AC自动机上跑一遍直到不能跑了为止,求跑了多长字符串。因为对于这么一个样例:字典中有eat和take两个词,文章是eatake,最长前缀是3而不是6,因为每个字符最多只能被包含在一个单词中。那么可以设f[i]表示前i个字符能否被理解(f[i]=0或1)。如果文章中从第i+1个字符到第j个字符是trie树上一个串,那么f[j]=f[i]。最后取i最大且f[i]为1的i值就是最长前缀长度了。
最后附上代码。
#include<cmath>
#include<queue>
#include<cstdio>
#include<cstring>
#include<cstdlib>
#include<iostream>
#include<algorithm>
using namespace std;
char s[2000010];
int a[300][26];
int end[300];
int n,m;
int cnt;
int fail[300];
int f[2000010];
void build(char *s)
{
int now=0;
int len=strlen(s);
for(int i=0;i<len;i++)
{
if(!a[now][s[i]-'a'])
{
a[now][s[i]-'a']=++cnt;
}
now=a[now][s[i]-'a'];
}
end[now]++;
}
int main()
{
scanf("%d%d",&n,&m);
for(int i=1;i<=n;i++)
{
scanf("%s",s);
build(s);
}
while(m--)
{
scanf("%s",s);
int l=strlen(s);
memset(f,0,sizeof(f));
f[0]=1;
for(int i=0;i<l;i++)
{
if(f[i])
{
int now=0;
for(int j=i;a[now][s[j]-'a'];j++)
{
now=a[now][s[j]-'a'];
if(end[now])
{
f[j+1]|=f[i];
}
}
}
}
for(int i=l;i>=0;i--)
{
if(f[i])
{
printf("%d\n",i);
break;
}
}
}
}
上一篇:easyui表单校验拓展


下一篇:ViewPager+Fragment取消预加载(延迟加载)(转)