本篇内容将持续更新。
CDQ 分治是一种离线的分治算法。其主要思想是,对于一个规模为 \(n\) 的问题,首先计算 \([1,\left \lfloor \dfrac n2 \right \rfloor],[\left \lfloor \dfrac n2 \right \rfloor+1,n]\) 这两个子问题内部的答案,再计算这两个子问题相互贡献的答案。
一个比较经典的问题是三维偏序问题:
给定 \(n\) 个三元组 \((a_1,b_1,c_1),(a_2,b_2,c_2),\cdots,(a_n,b_n,c_n)\),求满足 \(a_i \leq a_j\) 且 \(b_i \leq b_j\) 且 \(c_i \leq c_j\) 的二元组 \(i,j\) 数量。没有两个三元组是完全相同的。
\(1 \leq n \leq 10^5, 1\leq a_i,b_i,c_i \leq 2 \times 10^5\)
首先可以按照 \(a\) 进行升序排序,消去一维影响。接下来,我们分治处理。对于当前处理的区间 \([l,r]\),如果 \(l=r\),那什么都不用做。否则,递归处理 \([l,mid]\) 和 \([mid+1,r]\) 内部的贡献,并将它们分别按照 \(b\) 升序排序。这样,区间 \([l,mid]\) 和 \([mid+1,r]\) 满足:
- 区间内部三元组的 \(b\) 递增。
- 区间 \([l,mid]\) 内部任意三元组的 \(a\) 都小于等于区间 \([mid+1,r]\) 内部任意三元组的 \(a\)。这是因为在操作前按照 \(a\) 对所有三元组进行了排序,就算区间内部按照 \(b\) 进行了重排也不影响该性质。
我们维护一个树状数组。我们顺序处理区间 \([mid+1,r]\) 的每一个三元组。设当前处理到的三元组编号为 \(j(mid < j< r)\),将编号为 \(k (l \le k\leq mid)\) 的所有满足 \(b_k \leq b_j\) 的三元组的 \(c_k\) 加入树状数组中,然后在树状数组中查询小于等于 \(c_j\) 的值数量,就得到了 \([l,mid]\) 对 \(j\) 的贡献。
这样看上去复杂度根本不对?对于一个长度为 \(2m\) 的区间,复杂度似乎是 \(O(m^2 + m \log \max\{c\})\) 的...
因为两个区间内部的 \(b\) 递增,所以在处理的过程中,树状数组中的 \(c_k\) 一定是从 \(c_l\) 开始,连续的一段。用一个左指针维护当前加入的 \(c_k\) 的最后一个位置 \(pos\)。当我们从处理 \(j-1\) 变为处理 \(j\) 时,就把 \(pos\) 一直往右移动,直到 \(b_{pos} > b_j\) 或者 \(pos > mid\)。
对于一个长度为 \(2m\) 的区间,\(pos\) 至多移动 \(m\) 次,复杂度瓶颈变为树状数组的 \(O(m \log \max\{c\})\)。
递归一次区间长度减半,那么至多递归 \(O(\log n)\) 次,总复杂度为 \(O(n \log n \log \max\{c\})\)。
例题 [BOI2007]Mokia
题意
给定 \(w \times w\) 的矩阵,初始全 \(0\),要求支持单点修改,子矩阵求和。
\(1 \leq w \leq 2 \times 10^6\),修改次数 $ \leq 1.6 \times 10^5$,查询次数 $ \leq 10^4$
题解
首先将询问差分一下,对于子矩阵 \((lx,ly,rx,ry)\) 的查询可以转化为 \((1,1,rx,ry)-(1,1,lx-1,ry)-(1,1,rx,ly-1)+(1,1,lx-1,ly-1)\)。
而对于 \((1,1,x,y)\) 的查询,其实就是查有多少个在 \((a,b)\) 的修改满足 \(a \leq x,b \leq y\) 且该修改在查询之前。
将时间作为 \(a\),\(x\) 坐标作为 \(b\),\(y\) 坐标作为 \(c\),就是一个三维偏序问题。
# include <bits/stdc++.h>
const int N=100010,MAXW=2e6+10,INF=0x3f3f3f3f;
struct Node{
int ti,x,y;
int id,val;
}a[N*8];
int w,cnt;
int ans[N];
int querytot;
int sum[MAXW];
inline int read(void){
int res,f=1;
char c;
while((c=getchar())<'0'||c>'9')
if(c=='-')f=-1;
res=c-48;
while((c=getchar())>='0'&&c<='9')
res=res*10+c-48;
return res*f;
}
inline bool cmp_x(const Node u,const Node &v){
return (u.x==v.x)?(u.y<v.y):(u.x<v.x);
}
inline int lowbit(int x){
return x&(-x);
}
inline void add(int x,int v){
if(!x)
return;
for(;x<=w;x+=lowbit(x)){
sum[x]+=v;
}
return;
}
inline int query(int x){
int res=0;
for(;x;x-=lowbit(x)){
res+=sum[x];
}
return res;
}
void CDQ(int l,int r){
if(l==r){
return;
}
int mid=(l+r)>>1,pL=l,pR=mid+1;
CDQ(l,mid),CDQ(mid+1,r);
std::sort(a+l,a+1+mid,cmp_x),std::sort(a+mid+1,a+r+1,cmp_x); // 因为复杂度瓶颈是树状数组的 log 这里直接 sort 也是没有问题的(当然也可以归并排序)
for(;pR<=r;++pR){
for(;pL<=mid&&a[pL].x<=a[pR].x;++pL){
if(!a[pL].id){ // 是修改操作
add(a[pL].y,a[pL].val);
}
}
if(a[pR].id){ // 是查询操作
ans[a[pR].id]+=a[pR].val*query(a[pR].y);
}
}
for(int i=l;i<pL;++i){
if(!a[i].id) // 还原树状数组
add(a[i].y,-a[i].val);
}
return;
}
int main(void){
read(),w=read();
for(int opt,i=1;(opt=read())!=3;++i){
if(opt==1){
int x=read(),y=read(),v=read();
a[++cnt]=(Node){i,x,y,0,v}; // 如果是修改操作 val 就是要加上的值
}else{
++querytot;
int lx=read(),ly=read(),rx=read(),ry=read();
a[++cnt]=(Node){i,rx,ry,querytot,1};
a[++cnt]=(Node){i,rx,ly-1,querytot,-1};
a[++cnt]=(Node){i,lx-1,ry,querytot,-1};
a[++cnt]=(Node){i,lx-1,ly-1,querytot,1}; // 如果是查询操作 id 就是询问编号 val 是该前缀矩阵的权值
}
}
CDQ(1,cnt);
for(int i=1;i<=querytot;++i){
printf("%d\n",ans[i]);
}
return 0;
}