cdq是何许人也?请参看这篇:https://wenku.baidu.com/view/3b913556fd0a79563d1e7245.html。
在这篇论文中,cdq提出了对修改/询问型问题(Modify-Query问题)的分治做法,下面来具体讨论一下:
我们将修改/询问看作在时间轴上的一系列元素,把修改和询问统称为“操作”,并用记号\([l,r]\)表示第\(l\)个操作到第\(r\)个操作的序列。
在时间轴上进行的操作,众所周知有这样的特性:时间早的会影响时间晚的,而反过来不会,这就是cdq分治的本质:用前面的修改更新后面的答案。
假设我们要计算一段长为\(m\)的区间\([l,r]\)的答案,考虑计算\([l,mid]\)和\([mid+1,r]\),最终将两段区间合并,其中\(mid=\left\lfloor\frac{l+r}{2}\right\rfloor\)。
这里,\([l,r]\)的答案,指的就是,单纯的\([l,r]\)的答案。不考虑更早的操作对\([l,r]\)的影响。
这样的做法是否似曾相识?典型的分治—合并的思路,就出现在最稳定的排序方法——归并排序上。
其时间复杂度为\(T(1)=\Theta(1), T(n)=2T(\frac{n}{2})+\Theta(n)=\Theta(n\,log\,n)\),其中合并区间的复杂度为\(\Theta(n)\)。
提出这个例子只是为了回忆起对分治感觉和思路。
看一道例题,方便讲解:(这题就是论文中的题目)
给你\(q\)个操作:①插入一个点\((x,y)\),②询问当前所有的点中,满足\(x_i\leq x,y_i\leq y\)的点\(x_i,y_i\)的个数(\(1\leq q,x,y\leq 100000\))。
我们采用cdq分治的方法,将这些操作按照时间顺序分治。
假设我们要获取\([l,r]\)的答案,而我们已经对\([l,mid],[mid+1,r]\)进行了递归处理,这时我们需要处理出完整的答案。
就像归并排序的过程一样,左边的区间和右边的区间都自己处理好自己的答案了,可是整个区间的答案仍没有完全算出,这是因为没有考虑左边区间对右边区间的影响。
在本题中,“影响”就是\([l,mid]\)中插入的点,会被统计到\([mid+1,r]\)中去。
这时,发现(可以造成影响的)左侧只有修改,右侧只有询问,考虑将修改和询问都按照他们的\(x_i\)为第一关键字,\(y_i\)为第二关键字,修改优先,查询后置为第三关键字排序,放到树状数组里去处理。
因为不需要考虑时间的顺序了,所以这很容易就能做到。
时间复杂度统计:\(T(1)=\Theta(1),T(n)=2T(\frac{n}{2})+\Theta(n\,log\,y)=\Theta(n\,log\,n\,log\,y)\)。
分析:使用cdq分治,我们将有时间顺序的操作转换成修改在前,询问在后的操作,相当于把问题简单化,“去时间化”了。
更深入地说,对于这样一个问题:初始时有一些三维点\((x_i,y_i,z_i)\),只需要查询满足\(x_i\leq x,y_i\leq y,z_i\leq z\)的点\(x_i,y_i,z_i\)的个数。
这看似和上一题相比,多了一维,但是若我们将所有的点和查询按照\(z_i,x_i,y_i,\)修改-查询依次为关键字排序,再把\(z\)坐标扔掉,这不就把空间上的维度转化成时间轴上的顺序了吗?所以这题本质上和上一题相同,可以用同样的算法解决。
这题就是洛谷的P3810 三维偏序,我的代码如下:
#include<cstdio>
#include<algorithm>
struct ww{int x,y,z,w,I;}a[],tmp[];
inline bool cmp1(ww p1,ww p2){return p1.x==p2.x?(p1.y==p2.y?p1.z<p2.z:p1.y<p2.y):p1.x<p2.x;}
int n,nn,k,bit[],ans[],Ans[];
inline void Ins(int i,int x){for(;i<=k;bit[i]+=x,i+=i&-i);}
inline int Qur(int i){int sum=;for(;i;sum+=bit[i],i-=i&-i);return sum;}
void cdq(int l,int r){
if(l==r) return;
int mid=(l+r)>>;
cdq(l,mid); cdq(mid+,r);
for(int i=l,lf=l,rt=mid+;lf<=mid||rt<=r;++i){
if((lf<=mid&&rt>r)||(lf<=mid&&rt<=r&&a[lf].y<=a[rt].y)) Ins(a[lf].z,a[lf].w), tmp[i]=a[lf], ++lf;
else Ans[a[rt].I]+=Qur(a[rt].z), tmp[i]=a[rt], ++rt;
}
for(int i=l;i<=mid;++i) Ins(a[i].z,-a[i].w);
for(int i=l;i<=r;++i) a[i]=tmp[i];
}
int main(){
scanf("%d%d",&n,&k);
for(int i=;i<=n;++i) scanf("%d%d%d",&a[i].x,&a[i].y,&a[i].z);
std::sort(a+,a+n+,cmp1);
for(int i=;i<=n;++i) if(a[i].x!=a[i-].x||a[i].y!=a[i-].y||a[i].z!=a[i-].z) a[++nn]=a[i], a[nn].w=, a[nn].I=nn; else ++a[nn].w;
cdq(,nn);
for(int i=;i<=nn;++i) ans[Ans[a[i].I]+a[i].w-]+=a[i].w;
for(int i=;i<n;++i) printf("%d\n",ans[i]);
return ;
}
偏序其实就是两个元素的值都对应地大(小)(等)于的关系,有时间顺序的问题也可以通过记时间标记转化成偏序问题,上面的两道题就是偏序问题。
数据结构(树状数组,线段树,平衡树等)通常可以处理较低维的偏序问题,而cdq分治则是处理偏序问题的利器。
把偏序问题中的某一维排序变为时间轴,在这时间轴之上分治处理,在合并时,就巧妙地将修改和查询分离开来,成为两个不相交的部分,没有了时间顺序的困扰,解决自然变得容易。
若是更高维的偏序,转化后仍不能处理的,我们可以将转化后的(没有时间顺序的)操作序列再排序,分离出时间轴来,对之下的在进行一次cdq分治,即cdq套cdq。
这样做,思维难度、代码复杂度以及调试难度都有所提升,但cdq分治本质上熟练了就很好写了,应该要多多益善地练习相关题目。
运用cdq的注意事项:所有的修改和查询都必须是已知的,即cdq是离线算法,对于强制在线的题目,就要另寻他法了。
cdq分治的应用不止于此,还有许多问题,运用相似的思想——分治,也能获得简便的解决,在此就不一一列举了。
更多例题:P4093 [HEOI2016/TJOI2016]序列