http://acm.hdu.edu.cn/showproblem.php?pid=4821
题意:
给出一个字符串,现在问你可以找出多少个长度为M*L的子串,该子串被分成L个段,并且每个段的字符串都是不同的。
思路:
看BKDRHash看了半天,很神奇~。关于这个,大家可以看一下这篇博客http://blog.csdn.net/xu20082100226/article/details/52651072。
先计算出整个串的哈希值,套用公式$Hash[i]=Hash[i+1]*SEED+(ss[i]-'a'+1)$,这里SEED一般就是取个素数,Hash[i]表示第i个字符到终点的哈希值。然后枚举起点,由于一开始已经计算出了整个串的哈希值,所以长度为L的字符串的哈希值可以很容易的求出。用map来映射不同值出现的次数,如果mp.size()==M的话,那就说明这个子串是符合条件的。具体的一些说明可以看代码。
需要注意的是,由于hash的计算最后会使值很大,所以这里数据类型可以用usigned long long,可以自动取模。
#include<iostream>
#include<algorithm>
#include<cstring>
#include<cstdio>
#include<sstream>
#include<vector>
#include<stack>
#include<queue>
#include<cmath>
#include<map>
#include<set>
using namespace std;
typedef long long ll;
typedef pair<int,int> pll;
const int INF = 0x3f3f3f3f;
const int maxn = +; const int SEED = ; char s[maxn];
int M,L;
unsigned long long base[maxn];
unsigned long long Hash[maxn]; map<unsigned long long, int> mp; int main()
{
//freopen("in.txt","r",stdin);
while(~scanf("%d%d",&M,&L))
{
scanf("%s",s);
int len=strlen(s);
base[]=;
for(int i=;i<=L;i++)
base[i]=base[i-]*SEED;
Hash[len]=;
for(int i=len-;i>=;i--)
Hash[i]=Hash[i+]*SEED+(s[i]-'a'+); int ans=;
for(int i=;i<L && i+M*L<len;i++) //枚举字符串的起点
{
mp.clear();
for(int j=i;j<i+M*L;j+=L)
{
mp[Hash[j]-Hash[j+L]*base[L]]++;
}
if(mp.size()==M) ans++; for(int j=i+M*L;j<=len-L;j+=L) //滑动窗口
{
mp[Hash[j-M*L]-Hash[j-M*L+L]*base[L]]--; //去掉最左边的那一段长度L的字符串
if(mp[Hash[j-M*L]-Hash[j-M*L+L]*base[L]]==) mp.erase(Hash[j-M*L]-Hash[j-M*L+L]*base[L]); //右边新加一段
mp[Hash[j]-Hash[j+L]*base[L]]++;
if(mp.size()==M) ans++;
}
}
printf("%d\n",ans);
}
return ;
}