FBI Warning:本文含有大量人类的本质之一
后缀树
反正后缀树就是反串的后缀自动机的 Parent 树,就不管了。
然而 SAM 也忘了
好的假装自己会吧——dls
后缀自动机
大概记得,不管了。
回文树/回文自动机
大概记得,不管了。
[HEOI/TJOI2016]字符串
给一个字符串 \(s\),\(m\) 次询问,每次问 \(s[a\dots b]\) 的所有子串和 \(s[c\dots d]\) 的 LCP 长度最大值。
\(|s|,m\le 10^5\)
就是求 \(s[a\dots b]\) 所有后缀和 \(s[c\dots d]\) LCP 长度最大值。
就是求 \(s[a\dots b]\) 所有后缀和 \(suf_c\) LCP 长度最大值,再跟 \(d-c+1\) 取个 \(\min\)。
就是求 \(suf_i(a\le i\le b)\) 和 \(suf_c\) LCP 长度和 \(b-i+1\) 取 \(\min\) 的最大值,再跟 \(d-c+1\) 取个 \(\min\)。
应该可以主席树搞一搞。
我就用 SA,用你妹的 SAM,SA 多好想
NOI2016 失恋十联测 D5T2
一个字符串 \(S\) 一开始空的,\(q\) 次操作,每次回到第 \(x\) 个操作之后,然后在末尾加上 \(c_i\)。
每次操作后问最小循环节长度。强制在线。
\(q\le 10^5\),字符集大小 \(\le 10^5\)
KMP 是均摊的,飞了。
但是有个办法:
为什么会飞?因为一次操作可能会往回跳很多次,那我重复它很多次他就没了。
那么可以有个办法避免重复跳:
\(trans[x][c]\) 表示在第 \(x\) 个字符后接个 \(c\),最后会跳到哪。
如果 \(s[x+1]=c\),那么 \(trans[x][c]=x\)。否则 \(trans[x][c]=trans[next[x]][c]\)。
那么发现 \(trans[x]\) 和 \(trans[next[x]]\) 只差了一个位置,用可持久化线段树就能保证复杂度了。
还有一个办法:
当 \(next[x]\le \frac{x}{2}\) 时,直接跳。
当 \(next[x]>\frac{x}{2}\) 时,把 \(x\) 膜个 \(x-next[x]\) 就好了。因为循环节长度是 \(x-next[x]\),所以如果 \(x\) 不行,那么 \(x-k(x-next[x])\) 也不行。
复杂度就是严格的 \(\log\) 了。
BZOJ 4310
长 \(n\) 的字符串 \(S\),请将 \(S\) 分成不超过 \(k\) 段,使得一段的所有子串中,字典序最大的最小。
\(|S|\le 10^5,k\le 15\)。
求出 SA,肯定要把 rk 最大的几个切开,二分最大的串保留的前缀长度。
(在搞组队于是掉线了)
咕了。
NOI赛前集训2019 D6T3
上面的加强版。
咕了。
Fim1
给字符串 \(S\),维护字符串序列 \(T\)。
\(m\) 次操作,要么是在 \(T\) 后面加个 \(T[x]+c\),要么是在 \(T\) 后面加个 \(c+T[x]\),要么问 \(T[x]\) 在 \(S[l,r]\) 的出现次数。
全是 \(10^5\)。
首先如果不是子串,肯定是 \(0\)。
否则对 \(S\) 建个 SAM,维护每个 \(T[x]\) 是在哪个点上,询问就变成求子树中 \(right\) 集合有多少个在 \([l+len-1,r]\)。
这个线段树合并一波解决。
修改操作,第一种就是按转移边走,第二种就是先判目前节点行不行,不行就选一个 parent 树上的儿子。
???
区间本质不同子串个数
区间本质不同回文串个数
第一问:离线,枚举右端点,维护 \(ans[l]\) 表示此时左端点在 \(l\) 的答案。
\(r\) 往右移一个时,会多出一堆后缀。其实就是 SAM 的 parent 树上 \(last\) 到根的链。
先考虑暴力跳。一个点对应一个区间的后缀,对不同的 \(l\) 有不同的贡献,随便线段树一下。具体要记 \(tag[i]\) 表示 \(i\) 号点上次在哪里出现,然后是跟 \(tag[i]\) 有关的。
但是不能暴力。
发现要把 \(tag[i]\) 赋成 \(r\)。
然后……就用 LCT 了???smg???
(好像是因为可以把 \(tag\) 一样一段的看成 LCT 上的实链,操作实际上就是把所有链并成一条实链,同时这样一段的 \(right\) 集合也是连续的一段,所以可以看成一个点操作)
第二问,咕了。
CF700E
一个字符串对另一个字符串是好的,当且仅当这个字符串在另一个字符串里出现了至少两次。
给字符串 \(S_1\),求最大的 \(k\) 使得存在字符串序列 \(S_i(1\le i\le k)\) 使得 \(S_{i+1}\) 对 \(S_i\) 是好的。
首先 \(S_{i+1}\) 一定是 \(S_i\) 的后缀。
为什么?
咕了。
???
给字符串 \(S\),定义 \(plcp(x,y)\) 表示后缀 \(x\) 和后缀 \(y\) 的最长公共回文前缀。
\(F(x)=\sum\limits_{i=0}^x\sum\limits_{j=0}^xplcp(i,j)\)
\(q\) 次操作,每次在 \(S\) 末尾加一个字符,输出 \(F(|S|)\)。强制在线。
\(|S|,q\le 10^5\)。
实际上就是回文树上两点 LCA 的深度。
每次加入一个点,求它和每个点的 LCA 深度之和。
然后……传说可以 LCT????
……
其实树剖也行。
???
求一个字符串的所有子串中,任选 2 个,计算 \(\sum[|A|+|B|-2lcp(A,B)\le L]\)。
\(n\le 10^5\)
虽然忘了 SAM 了,但是感受一波,感觉就是建后缀自动机,然后 parent 树上 \(\sum\limits_{u,v}(len[u]-len[fa[u]])(len[v]-len[fa[v]])(dis(u,v)\le L)\)。
感觉是个裸的淀粉质啊……
事实证明感受错了。是 \(\sum\limits_{u,v}[dis(u,v)\le L]\),而且因为每个节点代表了一堆串,所以会再多一些奇怪的系数。
然后不会树分。连串随机的边分都不会。
然后就……死了。
咕了。
Deep Purple
长 \(n\) 的字符串 \(S\),\(q\) 次询问,每次询问 \(S[l\dots r]\) 的 LBorder。
\(n,q\le 10^5\)
我们要找到一个最小的 \(i\) 使得 \(l\le i\le r\le i+lcp(i,l)-1\)。答案就是 \(r-i+1\)。
离线,从左往右扫,依次加入询问,依次加入 \(l\) 和 \(i\),注意到对于 \(l\) 我们只要求最小的 \(i\),所以加入
咕了。
NOI2019赛前集训 D6T2
怎么这么眼熟……
咕了。
Lyndon 串
对于字符串 \(s\),如果 \(s\) 的最小后缀是他本身,那么它是个 Lyndon 串。
等价于它是所有循环移位中字典序最小的一个。
若 \(u,v\) 是 Lyndon 串,那么 \(uv\) 是 Lyndon 串当且仅当 \(u<v\)。
我们可以把任意串 \(v\) 分解成 \(v=v_1v_2v_3\dots v_m\)。其中 \(v_i\) 是 Lyndon 串且 \(v_i\ge v_{i+1}\)。这被称为 Lyndon 分解。
怎么求?初始时 \(n\) 段,每段一个字符,然后如果 \(v_i<v_{i+1}\) 合并。
有唯一性:
设 \(pre(s,i)\) 表示串 \(s\) 中 \(s[1…i]\) 所代表的前缀
若有两种方案,取第一次不同的位置,设 \(|s_i|>|s'_i|\)
令 \(s_i=s'_is'_{i+1}…s'_kpre(s_{k+1},l)\)
反证法。根据定义,\(s_i<pre(s'_{k+1},l)\le s'_{k+1}\le s'_i<s_i\)
矛盾。
Duval 算法
\(O(n)\) 求 Lyndon 分解。
引理:若字符串 \(v\) 和字符 \(c\) 满足 \(vc\) 是某个 Lyndon 串的前缀,那么对于 \(d>c\) 有 \(vd\) 是 Lyndon 串。
维护三个变量 \(i,j,k\),
(之前广州集训的时候,这个也刚好生病错过去了……)
咕了。
NOI2019 赛前集训 D6T3
又 tm 这么眼熟……
咕了。