RMQ | ST 表 | 树状数组学习笔记

2023-12-14 08:47:40

前言

前段时间没啥空写博客，今天汇总一下这几天学的几种数据结构。

Part1. ST 表

ST 表是用于求解 RMQ（区间最值）问题的一种数据结构，使用了倍增的思想，时间复杂度 \(\mathcal{O}(n\log n)\)。

本人认为 ST 表很类似区间 dp。

有一个数组 \(a\)，假设现在要求静态区间最大值。

I. 创建 ST 表

首先定义 ST 表 \(st_{i,j}\) 表示 \([i,i+2^j-1]\) 这段区间的最大值。数学公式有点别扭，说白了就是以 \(i\) 开始的 \(2^j\) 个数中的最大值。

由于 \(2^0=1\)，所以 \(st_{i,0}\) 就是 \(a_i\)（差不多是 dp 的边界条件吧）。

然后，我们要由小区间推出大区间，看图：

绿色数字代表 \(j\) 值。可见，\(st_{i,j}\) 是由两个小区间推出来的，很容易得到状态转移方程：

\[st_{i,j}=\max(st_{i,j-1},st_{i+2^{j-1},j-1}) \]

现在就类似区间 dp 那样，先枚举区间长度 \(j\)，再枚举左端点 \(i\)。

ST 表的创建代码如下：

for(int j=1;(1<<j)<=n;j++){
    for(int i=1;i+(1<<j)-1<=n;i++){
        st[i][j]=max(st[i][j-1],st[i+(1<<j-1)][j-1]);
    }
}

对 \(i\) 和 \(j\) 枚举范围的解释：

\(j\) 作为区间长度，自然不能超过 \(n\)。
\(i\) 作为左端点，我们知道 \(st_{i,j}\) 表示的区间是 \([i,i+2^j-1]\)，不能超过 \(n\)。

II. 求解 RMQ

创建好 ST 表，就要充分地利用它。

对于查询的区间 \([l,r]\)，组成它的两段子区间长度的指数 \(k=\log_2 (r-l+1)\)。

故答案为两段的最大值。

第一段就是 \([l,k]\)，但是第二段有点麻烦了。

由于 \(r-l+1\) 不一定满足 \(\log_2(r-l+1)\in\mathbb{N}\)，所以两端区间会有重合的部分，这不影响最终的结果，但是左端点就要由 \(r\) 推出来，即 \(r-2^k+1\)。

第二段区间就是 \([r-2^k+1,k]\)。

求解 RMQ 代码如下：

int k=log2(r-l+1);
writeln(max(st[l][k],st[r-(1<<k)+1][k]));

总结

ST 表运用的倍增思想，可以说跟分治有异曲同工之妙（虽然完全就不同）。

前者不断地将指数增加，求解 \(2^0\)，\(2^1\)，\(2^2\) 等子问题，再推出大问题。

后者呢是一个大问题，不断地二分下去（或者划成更多子问题）。

ST 表在 LCA 问题中也有广泛的运用。

Part2. 树状数组

最基本的树状数组可以维护单点修改、区间查询的问题，时间复杂度在 \(\mathcal{O}(\log n)\)，且常数较小。

树状数组运用了差分思想。

树状数组非常的优美，不像隔壁线段树，我 *@%^~?*#…，码量和常数都很大（相对树状数组）。

树状数组核心就 3 个函数，不过呢需要理解一个非常重要的点：lowbit。

简单来说，一个数的 lowbit 就是这个数在二进制下最低位的 \(1\) 所对于的值，例如 \((6)_{10}=(110)_2\)，那么它的 lowbit 就是 \(2\)。

lowbit 函数可以用如下代码实现：

inline int lowbit(int i){return i&-i;}

非常简洁。

树状数组直接用一个 \(c\) 表示即可，简单到我都不用专门建一个小节出来。

I. 单点修改

代码如下：

void add(int i,int k){for(;i<=n;i+=lowbit(i))c[i]+=k;}

II. 区间查询

树状数组可以简单维护前缀和。

代码如下：

int sum(int i){
    int s=0;
    for(;i;i-=lowbit(i))s+=c[i];
    return s;
}

至于区间查询，结合前缀和的思想即可写出来了。

拓展

树状数组有个很奇妙的用途就是求逆序对。

将树状数组当成一个加强的桶，每插入一个数 \(a_i\)，先给 \(c_{a_i}\leftarrow c_{a_i}+1\)，答案就加上 \(i-\sum\limits_{j=1}^{a_i}a_j\) 即可。

那么，为什么？

\(c_{a_i}\leftarrow c_{a_i}+1\)：就是 \(a_i\) 的出现次数增加了 \(1\)，不要把这里的 \(c\) 当树状数组，当成一个普通的桶即可。

\(i-\sum\limits_{j=1}^{a_i}a_j\)：到目前出现了 \(i\) 个数，减去小于它的数的出现次数。

如果是 P1908 的话还需要离散化处理，这里不细说了。

代码实现：

int ans=0;
for(int i=1;i<=n;i++){
    a[i]=read();
    add(a[i],1);
    ans+=i-sum(a[i]);
}

总结

之后的树套树，若是树状数组的话，处理起来会比线段树、平衡树简单很多。

但是呢它简便，维护的东西自然少，树状数组能维护的东西，线段树都能维护。

至于求逆序对，理解还是有点困难的（至少对于我），理解之后会发现非常的巧妙。

码农公寓

前言