一种利用分治进行树上路径统计的算法,算法时间复杂度一般为 $O(n\log n)$。
所有路径分为两种,一种是过根结点的,一种是完全在根结点的某棵子树中的。
因此可以考虑分治算法,选取一个点将无根树转换为有根树,然后递归处理每个棵以根节点的儿子为根的子树。
如果选取树的重心作为根结点,则每棵子树的结点个数不超过 $\frac n2$ ,可以保证递归深度不超过 $\log n$。
在这个基础上如果能在 $O(n)$ 时间维护经过根结点路径相关信息,则算法总时间复杂度为 $O(n\log n)$。
重心的寻找可使用 dfs,处理出所有结点的 $\text{sz}$ ,所有结点的最大子树 $\text{mson}(u)=\max\left(\max\left(\text{sz}\left(\text{son}\left(u\right)\right),\text{tot_sz}-\text{sz}\left(u\right)\right)\right)$。
不断更新 $\text{mson}$ 最小的结点,最后便可以得到重心,时间复杂度 $O(n)$。
分治过程需要注意标记已经访问的结点,同时更新子树大小 $\text{tot_sz}$ ,具体实现见模板。
题目大意是说给定一棵 $n$ 个结点的正权树,多次查询,每次查询是否存在长度为 $k$ 的路径。
对根结点,先考虑暴力法,用树形 dp 求出子树上各节点到根结点的距离,然后两两枚举,看看有没有两个结点距离和为 $k$。
这样每层递归的时间复杂度是 $O(n^2)$,显然会 T。
考虑用中途相遇法,可以将每层递归的时间复杂度优化到 $O(n)$,单次查询时间复杂度 $O(n\log n)$。
但要注意三点:
一、枚举过根结点的路径时路径两端点显然不能在同一棵子树里,所以要先求出一棵子树所有的 $\text{dist}$,全部判断完后再进行标记。
二、题目给定 $k\le 10^7$,所以不用标记大于 $10^7$ 的 $\text{dist}$。
三、清空标记不能用 $\text{memset}$,会 T,这里开了一个 $\text{vector}$ 来记录之前的标记。
另一个优化是可以离线处理查询,这样只需要分治一次,可以减小常数。
给一棵树,每条边有权。求一条简单路径,权值和等于 $q$,且边的数量最小。
类似习题1,开个 $\text{mark}$ 数组存一下到根结点距离为 $\text{dist}$ 的路径的最短边数。
$\text{vector}$ 不仅要记录距离,还要记录深度,时间复杂度 $O(n\log n)$。
给定一棵 $n$ 个结点的正权树和一个正数 $k$,统计有多少对结点 $(a,b)$ 满足 $\text{dist}(a,b)\le k$。
把中途相遇法换成树状数组或名次树即可,时间复杂度 $O(n\log^2 n)$。
给定一棵 $n$ 个结点的树,每条边包含长度 $L$ 和费用 $D (1\le D,L \le 1000)$ 。选择一条总费用不超过 $m$ 的路径,使得路径总长度最大。
考虑过根结点的路径,枚举到结点 $i$ 时,设它到根结点的路径费用为 $c(i)$。
需要在已经枚举的其他子树中的结点中选取费用不超过 $D-c(i)$ 的最长路径。
对结点 $v_1$ 和 $v_2$ ,如果 $v_1$ 费用大于 $v_2$ ,长度小于 $v_2$ ,那 $v_1$ 显然不会对后续答案产生贡献。
因此可以考虑单调队列维护对答案有贡献的点集,总时间复杂度 $O(n\log^2 n)$。
另外本题存在 $O(n\log n)$ 解法,有兴趣的可以自己尝试。
给定一棵 $n$ 个结点的树,树的每个节点有个颜色。
定义 $s(i,j)$ 为 $i$ 到 $j$ 的颜色数量,$\text{sum}_i=\sum_{j=1}^n s(i,j)$,要求输出所有 $\text{sum}_i$。
这题需要计算贡献,先考虑根结点,仅一端为根结点的路径对根结点的答案有贡献。
考虑 dfs 处理子树,若一条路径上的某种颜色第一次出现,立刻计算它的贡献,贡献为它所在的子树大小。
经过这遍 dfs ,可以得到所有子树到根结点的贡献。
再考虑所有经过根结点的路径(包含一端为根结点的路径)对所有子树结点答案的影响。
对每棵子树上的结点而言,所有经过根结点的路径可以分为一条从其他子树到根结点的路径(也可以是空路径)和一条从根结点到该结点的路径。
可以考虑多次利用之前计算出的所有子树到根结点的贡献。
对每棵子树,先消去该子树对根结点的贡献,便可以得到所有其他子树到根结点的路径贡献。
再重新对该子树进行遍历,更新该子树上每个点的贡献值。
最后把消去子树对根结点的贡献再改回去即可。
总时间复杂度 $O(n\log n)$ ,另外本题存在 $O(n)$ 解法,有兴趣的可以自己尝试。