I.II.[POI2014]HOT-Hotels 加强版
易于发现,三点间两两距离相等,当且仅当两个LCA较深的点到它们的LCA距离相等,且第三个点到该LCA的距离与前两个点相同。
于是我们设 \(f_{x,i}\) 表示 \(x\) 子树中有多少对点,它们到LCA距离相同,且上述距离比该LCA到 \(x\) 的距离长 \(i\)。考虑现在将子树 \(y\) 合并进答案。
则有 \(f_{x,i}\times g_{y,i+1}\rightarrow ans\),\(g_{x,i}\times f_{y,i-1}\rightarrow ans\),\(f_{x,i}\times f_{y,i-1}\rightarrow g_{x,i}\),\(f_{y,i-1}\rightarrow f_{x,i}\),\(g_{y,i+1}\rightarrow g_{x,i}\)。
但是这显然过不去 \(10^5\) 的数据。
但是,因为DP状态与深度有关,就可以考虑长链剖分优化。具体而言,考虑到仅有一个儿子时,直接有 \(f_{y,i-1}\rightarrow f_{x,i}\) ,\(g_{y,i+1}\rightarrow g_{x,i}\),以及一个 \(g_{y,1}\rightarrow ans\),可以直接通过指针之类 \(O(1)\) 转移。则如果我们考虑继承长儿子的答案的话,就会大大优化复杂度。具体优化了多少呢?总复杂度可以被证明是 \(O(n)\) 的。
指针使用时要极其小心,不能调用奇奇怪怪的东西,不能越界,一定要仔细算好范围。
时间复杂度 \(O(n)\)。
代码:
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
int n,dep[100100],son[100100];
int F[500100],*f[100100],*ff=F;
ll G[500100],*g[100100],res,*gg=G;
vector<int>v[100100];
void dfs1(int x,int fa){
for(auto y:v[x])if(y!=fa){dfs1(y,x);if(dep[son[x]]<dep[y])son[x]=y;}
dep[x]=dep[son[x]]+1;
}
void init(int x){f[x]=ff,ff+=dep[x]+1,gg+=dep[x]+1,g[x]=gg,gg+=dep[x]+1;}
void dfs2(int x,int fa){
if(!f[x])f[x]=ff,ff+=(dep[x]<<1);
if(!g[x])gg+=dep[x],g[x]=gg,gg+=dep[x];
if(son[x])f[son[x]]=f[x]+1,g[son[x]]=g[x]-1,dfs2(son[x],x),res+=g[x][0];
f[x][0]=1;
for(auto y:v[x])if(y!=fa&&y!=son[x]){
dfs2(y,x);
for(int i=1;i<=dep[y];i++)res+=g[y][i]*f[x][i-1];
for(int i=0;i<=dep[y];i++)res+=g[x][i+1]*f[y][i];
for(int i=0;i<=dep[y];i++)g[x][i+1]+=1ll*f[x][i+1]*f[y][i];
for(int i=0;i<dep[y];i++)g[x][i]+=g[y][i+1];
for(int i=0;i<=dep[y];i++)f[x][i+1]+=f[y][i];
}
// printf("%d:\n",x);for(int i=0;i<=dep[x];i++)printf("%d %d\n",f[x][i],g[x][i]);
}
int main(){
scanf("%d",&n);
for(int i=1,x,y;i<n;i++)scanf("%d%d",&x,&y),v[x].push_back(y),v[y].push_back(x);
dep[0]=-1,dfs1(1,0);
// for(int i=1;i<=n;i++)printf("(%d %d)",dep[i],son[i]);puts("");
dfs2(1,0),printf("%lld\n",res);
return 0;
}