字符串哈希
作用:把一个字符串变成一个很大的数字,可以用于判断字符串出现次数或两个串是否相等
- 对数组、变量的定义:
string s:字符串 题目中要求s的hash
int base:一个较大质数 一般为233或23333 表示进制 字符串的哈希值实际上是一个base进制数
ull h[]:哈希值(前缀和) 使用ull是为了自然溢出 h[i]代表从字符串的第1位到第i为的哈希值
ull p[]:进制数组 p[i]=x表示字符串的第i位转换成数字时要乘以x
- 对进制数组、哈希值数组的处理:
p[0]=1;//无第0位,赋值为1是为了方便后续运算
for(int i=1;i<=n;i++)
{
p[i]=p[i-1]*base;//每一位的进制都是前一位的进制乘以base(左移一位)
h[i]=h[i-1]*base+s[i];//前i位的哈希值位前i-1位的哈希值乘以进制再加上当前位
}
举例:
若输入的s为"ABCDEFG"
h[1]("A")的值为'A'
h[2]("AB")的值为"A"×base+'B'
h[3]("ABC")的值为"AB"×base+'C'
以此类推
- 求子串的哈希值
ull shash(int l,int r)//求s中从l到r的子串的哈希值
return h[r]-h[l-1]*p[r-l+1];//从第1位到第r位的哈希值-从第1位到第l位的前一位的哈希值(乘以进制类似于填零补位)
举例:若输入的s为"ABCDEFG" l为2,r为5
所以从l到r的子串为"BCDE"
h[r]为"ABCDE"
h[l-1]为"A"
如果直接相减肯定会有错位 如下所示
ABCDE
- A
————
所以应该给"A"补位 要补的位数就是p数组
p[r-l+1]=4
所以A应左移4位
ABCDE
- A
————
BCDE
最后所得的结果就是"BCDE"
#include<bits/stdc++.h>
#define ull unsigned long long
#define N 500010
using namespace std;
ull p[N],h[N],flag;
ull b=233;
char s[N];
char ans[N];
int n;
ull shash(int l,int r)
{
return h[r]-h[l-1]*p[r-l+1];
}
bool findpos(int pos)
{
ull l,r;
int mid=1+n>>1;
if(pos==mid)
{
l=shash(1,mid-1);
r=shash(mid+1,n);
}
else if(pos<mid)
{
l=shash(1,pos-1)*p[mid-pos]+shash(pos+1,mid);
r=shash(mid+1,n);
}
else
{
l=shash(1,mid-1);
r=shash(mid,pos-1)*p[n-pos]+shash(pos+1,n);
}
if(l==r&&flag!=l)
{
flag=l;
if(pos<=mid)
{
for(int i=mid+1;i<=n;i++)
ans[i-mid]=s[i];
}
else
{
for(int i=1;i<mid;i++)
ans[i]=s[i];
}
return 1;
}
return 0;
}
int main()
{
cin>>n>>s+1;
p[0]=1;
for(int i=1;i<=n;i++)
p[i]=p[i-1]*b,h[i]=h[i-1]*b+s[i];
if(n%2==0)
{
cout<<"NOT POSSIBLE";
return 0;
}
int cnt=0;
for(int i=1;i<=n;i++)
{
cnt+=findpos(i);
if(cnt>1)
{
cout<<"NOT UNIQUE";
return 0;
}
}
if(cnt==0) cout<<"NOT POSSIBLE";
else cout<<ans+1;
return 0;
}