====== 数论 3 ====== ===== 杜教筛 ===== ==== 算法简介 ==== 一种 $O\left(n^{\frac 23}\right)$ 计算积性函数前缀和的算法。 ==== 算法思路 ==== 设 $f$、$g$ 为积性函数,$S(n)=\sum_{i=1}^n f(i)$,考虑 $f$、$g$ 的狄利克雷卷积的前缀和 \begin{equation}\sum_{i=1}^n (f\ast g)(i)=\sum_{i=1}^n\sum_{d\mid i}f(\frac id)g(d)=\sum_{d=1}^n \left(g(d)\sum_{k=1}^{\lfloor\frac nd\rfloor}f(k)\right)=\sum_{d=1}^n g(d)S(\lfloor\frac nd\rfloor)\end{equation} 所以有 \begin{equation}\sum_{i=1}^n (f\ast g)(i)=g(1)S(n)+\sum_{d=2}^n g(d)S(\lfloor\frac nd\rfloor)\end{equation} 移项得 \begin{equation}g(1)S(n)=\sum_{i=1}^n (f\ast g)(i)-\sum_{d=2}^n g(d)S(\lfloor\frac nd\rfloor)\end{equation} 观察式子,发现如果能快速求出 $(f\ast g)(n)$ 和 $g(n)$ 的前缀和,就可以通过整数分块和记忆化搜索快速求出 $S(n)$。 ==== 复杂度证明 ==== 下面假设 $(f\ast g)(n)$ 和 $g(n)$ 的前缀和可以 $O(1)$ 求出。 若要求出 $S(n)$,需要先求出 $S(\lfloor\frac nd\rfloor)(d=2\sim n)$。 事实上,有 $\{x|\exists d\left((2\le d\le n)\land \left(\lfloor\frac nd\rfloor=x\right)\right)\}\subseteq \{1,2,3\cdots \lfloor\sqrt n\rfloor\}\cup\{\lfloor\frac n2\rfloor,\lfloor\frac n3\rfloor,\lfloor\frac n4\rfloor\cdots \lfloor\frac n{\lfloor\sqrt n\rfloor}\rfloor\}$。 对 $m\in \{x|\exists d\left((2\le d\le n)\land \left(\lfloor\frac nd\rfloor=x\right)\right)\}$,有 \begin{equation}\{1,2,3\cdots \lfloor\sqrt m\rfloor\}\cup\{\lfloor\frac m2\rfloor,\lfloor\frac m3\rfloor,\lfloor\frac m4\rfloor\cdots \lfloor\frac m{\lfloor\sqrt m\rfloor}\rfloor\} \subset\{1,2,3\cdots \lfloor\sqrt n\rfloor\}\cup\{\lfloor\frac n2\rfloor,\lfloor\frac n3\rfloor,\lfloor\frac n4\rfloor\cdots \lfloor\frac n{\lfloor\sqrt n\rfloor}\rfloor\}\end{equation} 因为首先 $m\lt n$,于是 \begin{equation}\{1,2,3\cdots \lfloor\sqrt m\rfloor\}\subset\{1,2,3\cdots \lfloor\sqrt n\rfloor\}\end{equation} 设 $m=\lfloor\frac nd\rfloor$,有 \begin{equation}\{\lfloor\frac n{2d}\rfloor,\lfloor\frac n{3d}\rfloor,\lfloor\frac n{4d}\rfloor\cdots \lfloor\frac n{\lfloor\sqrt m\rfloor d}\rfloor\} \subset \{\lfloor\frac n2\rfloor,\lfloor\frac n3\rfloor,\lfloor\frac n4\rfloor\cdots \lfloor\frac n{\lfloor\sqrt n\rfloor}\rfloor\}\end{equation} 所以记忆化搜索只需要求出最开始的 $O(\sqrt n)$ 个状态,即 $\{1,2,3\cdots \lfloor\sqrt n\rfloor\}\cup\{\lfloor\frac n2\rfloor,\lfloor\frac n3\rfloor,\lfloor\frac n4\rfloor\cdots \lfloor\frac n{\lfloor\sqrt n\rfloor}\rfloor\}$ 根据整数分块,每个状态统计答案的时间复杂度为 $O(\sqrt n)$,总时间复杂度为 \begin{equation}\sum_{i=1}^{\lfloor\sqrt n\rfloor}\left(O(\sqrt i)+O\left(\sqrt {\frac ni}\right)\right)=O\left(\int_{x=1}^{\sqrt n}\sqrt x+\sqrt {\frac nx}\mathrm{d}x\right)=O\left(n^{\frac 34}\right)\end{equation} 考虑线性筛预处理前 $k$ 个前缀和 $(k\ge \sqrt n)$。 总时间复杂度变为 \begin{equation}O(k)+\sum_{i=1}^{\lfloor\sqrt {\frac nk}\rfloor}O\left(\sqrt {\frac ni}\right)=O(k)+O\left(\int_{x=1}^{\sqrt {\frac nk}}\sqrt {\frac nx}\mathrm{d}x\right)=O(k)+O\left(\frac n{\sqrt k}\right)\end{equation} 发现取 $k\sim n^{\frac 23}$ 时可以达到最佳时间复杂度 $O\left(n^{\frac 23}\right)$。 另外关于记忆化搜索的答案,建议用哈希表存储。 ==== 算法练习 ==== === 习题一 === [[https://www.luogu.com.cn/problem/P4213|洛谷p4213]] == 题意 == 给定正整数 $n$,求 \begin{equation}\text{ans}_1=\sum_{i=1}^n\varphi(i)\end{equation} \begin{equation}\text{ans}_2=\sum_{i=1}^n\mu(i)\end{equation} == 题解 == 取 $f=\varphi,g=I$,则$(f\ast g)=id$,根据杜教筛有 \begin{equation}I(1)S(n)=\sum_{i=1}^n id(i)-\sum_{d=2}^n I(d)S(\lfloor\frac nd\rfloor)\end{equation} 即 \begin{equation}S(n)=\frac {n(n+1)}2-\sum_{d=2}^n S(\lfloor\frac nd\rfloor)\end{equation} 取 $f=\mu,g=I$,则$(f\ast g)=e$,根据杜教筛有 \begin{equation}I(1)S(n)=\sum_{i=1}^n e(i)-\sum_{d=2}^n I(d)S(\lfloor\frac nd\rfloor)\end{equation} 即 \begin{equation}S(n)=1-\sum_{d=2}^n S(\lfloor\frac nd\rfloor)\end{equation} const int MAXP=5e6+5; bool vis[MAXP]; int prime[MAXP],mu[MAXP],cnt; LL phi[MAXP]; template struct HASH_Table{ static const int HASH_MOD=3000017,MAXS=5e6; struct cell{ T1 key;T2 val; int next; }e[MAXS]; int head[HASH_MOD],cnt; void clear(){mem(head,0);cnt=0;} T2 insert(T1 Key,T2 Value){ int h=Key%HASH_MOD; e[++cnt].key=Key,e[cnt].val=Value,e[cnt].next=head[h]; head[h]=cnt; return Value; } T2 find(T1 Key){ int h=Key%HASH_MOD; for(int i=head[h];i;i=e[i].next){ if(e[i].key==Key) return e[i].val; } return -1; } }; HASH_Table S_Mu; HASH_Table S_Phi; void Pre(){ vis[1]=true,mu[1]=1,phi[1]=1; _for(i,2,MAXP){ if(!vis[i])mu[i]=-1,phi[i]=i-1,prime[cnt++]=i; for(int j=0;j === 习题二 === [[https://www.luogu.com.cn/problem/P3768|洛谷p3768]] == 题意 == 给定 $n,p$,计算 \begin{equation}\sum_{i=1}^n\sum_{j=1}^n ij\text{gcd}(i,j)\bmod p\end{equation} == 题解 == 先把 $\text{gcd}$ 转化为莫比乌斯函数,有 \begin{equation}\sum_{i=1}^n\sum_{j=1}^n ij\text{gcd}(i,j)=\sum_{d=1}^n d\sum_{i=1}^n\sum_{j=1}^nij[(i,j)==d]=\sum_{d=1}^n d^3\sum_{i=1}^{\lfloor\frac nd\rfloor}\sum_{j=1}^{\lfloor\frac nd\rfloor}ij[(i,j)==1]=\sum_{d=1}^n d^3\sum_{i=1}^{\lfloor\frac nd\rfloor}\sum_{j=1}^{\lfloor\frac nd\rfloor}ij\sum_{k\mid (i,j)}\mu(k)\end{equation} 改变枚举顺序,有 \begin{equation}\sum_{d=1}^n d^3\sum_{i=1}^{\lfloor\frac nd\rfloor}\sum_{j=1}^{\lfloor\frac nd\rfloor}ij\sum_{k\mid (i,j)}\mu(k)=\sum_{d=1}^n d^3\sum_{k=1}^{\lfloor\frac nd\rfloor}\mu(k)\sum_{k\mid i}^{i\le\lfloor\frac nd\rfloor}i\sum_{k\mid j}^{j\le\lfloor\frac nd\rfloor}j=\sum_{d=1}^n d^3\sum_{k=1}^{\lfloor\frac nd\rfloor}k^2\mu(k)\left(\sum_{i=1}^{\lfloor\frac n{dk}\rfloor}i\right)^2\end{equation} 设 $dk=T,S(n)=\sum_{i=1}^n i$,将 $k=\frac Td$ 代入,有 \begin{equation}\sum_{d=1}^n d^3\sum_{k=1}^{\lfloor\frac nd\rfloor}k^2\mu(k)\left(\sum_{i=1}^{\lfloor\frac n{dk}\rfloor}i\right)^2=\sum_{T=1}^n S(\lfloor\frac nT\rfloor)T^2\sum_{d\mid T} d\mu\left(\frac Td\right)=\sum_{T=1}^n S(\lfloor\frac nT\rfloor)T^2\varphi(T)\end{equation} 考虑数论分块 $+$ 杜教筛,设 $F(n)=\sum_{i=1}^nf(i),f(n)=n^2\varphi(n),g(n)=n^2$,有 \begin{equation}(f\ast g)(n)=\sum_{d\mid n}f(d)g(\frac nd)=\sum_{d\mid n}d^2\varphi(d)\left(\frac nd\right)^2=n^2\sum_{d\mid n}\varphi(d)=n^3\end{equation} 根据杜教筛公式,有 \begin{equation}F(n)=\sum_{i=1}^n i^3-\sum_{d=2}^n d^2F\left(\lfloor\frac nd\rfloor\right)\end{equation} 再根据 $\sum_{i=1}^n i^3=\left(\frac {n(n+1)}2\right)^2,\sum_{i=1}^n i^2=\frac {n(n+1)(2n+1)}6$,便可以快速计算出 $F(n)$。 事实上,杜教筛在计算出 $F(n)$ 的同时也计算出了所有 $F\left(\lfloor\frac nd\rfloor\right)$ 的值。 所以利用记忆化搜索,外层嵌套分块不影响时间复杂度,仍为 $O\left(n^{\frac 23}\right)$。 int mod,inv2,inv6; int quick_pow(LL a,LL b,int mod){ LL t=1; while(b){ if(b&1) t=t*a%mod; a=a*a%mod; b>>=1; } return t%mod; } template struct HASH_Table{ static const int HASH_MOD=3000017,MAXS=5e6; struct cell{ T1 key;T2 val; int next; }e[MAXS]; int head[HASH_MOD],cnt; void clear(){mem(head,0);cnt=0;} T2 insert(T1 Key,T2 Value){ int h=Key%HASH_MOD; e[++cnt].key=Key,e[cnt].val=Value,e[cnt].next=head[h]; head[h]=cnt; return Value; } T2 find(T1 Key){ int h=Key%HASH_MOD; for(int i=head[h];i;i=e[i].next){ if(e[i].key==Key) return e[i].val; } return -1; } }; HASH_Table pre_2; const int MAXP=8e6; bool vis[MAXP]; int prime[MAXP],pre_1[MAXP],cnt; void Pre(){ vis[1]=true,pre_1[1]=1; _for(i,2,MAXP){ if(!vis[i])pre_1[i]=i-1,prime[cnt++]=i; for(int j=0;j