凸优化DP

Posted on 2019-03-28 | In 知识点整理

凸优化DP

简介

凸优化用于一类dp优化的问题

可以把一个$O(n)$的复杂度优化成$O(\log n)$

如果我们最后的dp数组在某一维上是凸壳就可以用凸壳来维护

在这种问题中我们如果不管这一维的影响可以很快地求出极值

我们就可以用凸优化的思想来操作

算法流程

假设我们的dp数组是$F(x)$并且满足$F(x)$的导数是单调函数

我们就可以对$F$函数进行一定的修改使得$F’(x)=F(x)+kx$函数的极值落在我们需要求的那一个点上

于是我们可以对斜率k进行二分，来求出最合适的那一个值

具体来说，这道题里面我们需要求的是树上k+1条点不相交路径的最大权值和

我们发现如果设$F(x)$表示选出x条不相交路径的最大权值，最后的F函数是一个上凸壳

然后我们就可以考虑二分出斜率的偏移量$w$

考虑它的实际意义，就是说每次多选出一条路径就需要加上额外的$w$代价，这样dp我们只需要记录最值和对应的路径条数就可以了

至于是要让路径条数最大化还是最小化因题而异

其实挺简单的算法，多做几道题就会了

loj2478
floj1935
WF2016 B

可持久化点分树

Posted on 2019-03-27 | In 知识点整理

可持久化点分树

简介

在一些神奇的问题中，光是维护点分树（动态点分治）是完全没有办法解决问题的，例如这道题，我们发现查询的区间是和树的形态无关的，这样的问题就不能单纯维护点分树，需要对点分树进行可持久化

算法流程

前置技能1.0 点分治

关于这个可以去看我上古时期的blog，如果这个都看不懂就直接退群吧。。。。

前置技能2.0 点分树（动态点分治）

听起来在点分治上加上了动态两个字，其实就是把点分治中分治中心用树型关系表示出来

在统计到一个点的信息的时候，我们就直接从这个点出发，往点分树父亲节点上跳，比如我们需要查询到u节点距离小于等k的点的个数，我们就先看当前分治中心u管辖区域内有多少个点和他的距离小于等于k，然后我们跳到prt[u]，查询在prt[u]的子树里面有多少个距离小于等于k - dis(prt[u], u)的节点，但是我们发现u的管辖区域内的点存在重复计算，所以我们需要把这一部分用相同的方法容斥掉，就可以计算答案了

修改和查询十分类似，不赘讲（江老著名梗）了

进入正题

可持久化点分树，就拿上面哪个cf题做例子吧，用问题作为切入点可能会好一些

首先我们可以发现这道题的查询是和树无关的，如果只有单点的查询是很快可以在点分树上处理出来的

并且我们知道查询是可以转化成前缀和查询的，于是就有了维护可持久化点分树的思路

因为平常的点分我们是从下到上更新，这次需要变成从上到下的插入，并且在点分树上添加出来一条新的链，所以在考虑继承上一个点分树的状态的时候，我们需要在插入的时候继承不改变的子树的信息，因此我们需要先将原来的树进行三度化处理，这样每个分治重心的儿子最多只有三个，就可以处理了

三度化的技巧主要在于理解左兄弟右儿子的思路，把所有的兄弟用长度为0的边串起来，这样在新的树上的距离就是在原树上的距离了，并且因为串两个兄弟只需要1个点，所以新的树的总点数也是$O(n)$级别的，不影响复杂度

具体代码实现长成这样：

void rebuild(int u, int fa) {
  int last = 0, tmp = 0;
  for (auto cur : edge[u]) {
    int v = cur.first, w = cur.second;
    if (v == fa) continue;
    ++tmp;
    if (tmp == 1) {
      addedge(u, v, w);
      addedge(v, u, w);
      last = u;
    } else if (tmp == ((signed) edge[u].size()) - (u != 1)) {
      addedge(last, v, w);
      addedge(v, last, w);
    } else {
      m++;
      addedge(last, m, 0);
      addedge(m, last, 0);
      last = m;
      addedge(m, v, w);
      addedge(v, m, w);
    }
  }
  for (auto cur : edge[u]) {
    int v = cur.first;
    if (v == fa) continue;
    rebuild(v, u);
  }
}

其中edge是原树的边，addedge是新树的边
然后因为我们需要在点分树上更新一直到节点u（当前的更新节点）
所以我们需要记录一下在点分树上u的每个祖先v是prt[v]的哪一个儿子
这个可以在第一次点分树预处理出来

然后为了保证复杂度（不要多一个log）
最好用$O(n\log n)$预处理，$O(1)$查询的LCA
就是在欧拉序上进行处理

namespace LCA {

int dep[N], st[N << 1][LOG], dfn[N], Log[N << 1], ind = 0;
ll dis[N];

void dfs(int u, int fa) {
  st[dfn[u] = ++ind][0] = u;
  for (int i = head[u]; i; i = E[i].nxt) {
    int v = E[i].v;
    if (v == fa) continue;
    dep[v] = dep[u] + 1;
    dis[v] = dis[u] + E[i].w;
    dfs(v, u);
    st[++ind][0] = u;
  }
}

int checkmin(int x, int y) {
  return dep[x] < dep[y] ? x : y;
}

void ST() {
  dfs(1, 0);
  for (int i = 2; i <= ind; i++) {
    Log[i] = Log[i >> 1] + 1;
  }
  for (int j = 1; j < LOG; j++) {
    for (int i = 1; i + (1 << j) - 1 <= ind; i++) {
      st[i][j] = checkmin(st[i][j - 1], st[i + (1 << (j - 1))][j - 1]);
    }
  }
}

int lca(int x, int y) {
  x = dfn[x], y = dfn[y];
  if (x > y) swap(x, y);
  int k = Log[y - x + 1];
  return checkmin(st[x][k], st[y - (1 << k) + 1][k]);
}

ll getdis(int x, int y) {
  return dis[x] + dis[y] - dis[lca(x, y)] * 2;
}

}

然后我们考虑普通的点分树在维护什么东西
首先是用来记录信息的值和用来进行容斥的值，因为这道题只需要记录距离，所以我们用两个值来表示就可以了，如果需要更复杂的维护就需要用到高级的数据结构了

我们查询到一个点的距离和的时候首先从根往下走，假设当前节点是v，查询节点是u，那么v除了u所在子树的所有点到u的所有距离就是除了u子树所有节点到v的距离和加上除了u所有子树的大小乘上u到v的距离

于是我们就可以进行容斥了

点分树部分的代码是这样的：


namespace Tree_Devide {

struct Node {
  int ch[3], id, siz;
  ll sum[2];
} s[N * LOG];

int siz[N], F[N], dep[N], siz_all, rt, cnt = 0;
int root[N];
bool vis[N];
vector<int> pre[N];

void getroot(int u, int fa) {
  siz[u] = 1;
  F[u] = 0;
  for (int i = head[u]; i; i = E[i].nxt) {
    int v = E[i].v;
    if (v == fa || vis[v]) continue;
    getroot(v, u);
    siz[u] += siz[v];
    F[u] = max(F[u], siz[v]);
  }
  F[u] = max(F[u], siz_all - siz[u]);
  if (F[u] < F[rt]) rt = u;
}

void devide(int u) {
  vis[u] = 1;
  s[u].id = u;
  for (int i = head[u]; i; i = E[i].nxt) {
    int v = E[i].v;
    if (vis[v]) continue;
    F[rt = 0] = siz_all = siz[v];
    getroot(v, 0);
    dep[rt] = dep[u] + 1;
    for (int j : pre[u]) {
      pre[rt].push_back(j);
    }
    for (int j = 0; j < 3; j++) {
      if (s[u].ch[j]) continue;
      s[u].ch[j] = rt;
      pre[rt].push_back(j);
      devide(rt);
      break;
    }
  }
}

void insert(int &t, int las, int u, int fa) {
  t = ++cnt;
  s[t] = s[las];
  s[t].siz++;
  s[t].sum[0] += getdis(s[t].id, u);
  if (fa) {
    s[t].sum[1] += getdis(s[fa].id, u);
  }
  if (s[t].id == u) return;
  insert(s[t].ch[pre[u][dep[s[t].id]]], s[las].ch[pre[u][dep[s[t].id]]], u, t);
}

ll query(int t, int u) {
  ll res = 0;
  for (int i = 0; i < dep[u]; i++) {
    int cur = s[t].ch[pre[u][i]];
    res += (s[t].siz - s[cur].siz) * getdis(s[t].id, u) + s[t].sum[0] - s[cur].sum[1];
    t = cur;
  }
  res += s[t].sum[0];
  return res;
}

void build() {
  F[rt = 0] = siz_all = cnt = m;
  getroot(1, 0);
  root[0] = rt;
  devide(rt);
  for (int i = 1; i <= n; i++) {
    insert(root[i], root[i - 1], a[i], 0);
  }
}

}

然后放一下cf757g的完整代码：

#include <bits/stdc++.h>

using namespace std;

typedef long long ll;
typedef pair<int, int> pi;

const int N = 4e5 + 10;
const int LOG = 20;

struct Edge {
  int v, w, nxt;
} E[N << 1];
int head[N], tot = 0;
int n, m, q, a[N];
vector<pi> edge[N];

void addedge(int u, int v, int w) {
  E[++tot] = (Edge) {v, w, head[u]};
  head[u] = tot;
}

void rebuild(int u, int fa) {
  int last = 0, tmp = 0;
  for (auto cur : edge[u]) {
    int v = cur.first, w = cur.second;
    if (v == fa) continue;
    ++tmp;
    if (tmp == 1) {
      addedge(u, v, w);
      addedge(v, u, w);
      last = u;
    } else if (tmp == ((signed) edge[u].size()) - (u != 1)) {
      addedge(last, v, w);
      addedge(v, last, w);
    } else {
      m++;
      addedge(last, m, 0);
      addedge(m, last, 0);
      last = m;
      addedge(m, v, w);
      addedge(v, m, w);
    }
  }
  for (auto cur : edge[u]) {
    int v = cur.first;
    if (v == fa) continue;
    rebuild(v, u);
  }
}

namespace LCA {

int dep[N], st[N << 1][LOG], dfn[N], Log[N << 1], ind = 0;
ll dis[N];

void dfs(int u, int fa) {
  st[dfn[u] = ++ind][0] = u;
  for (int i = head[u]; i; i = E[i].nxt) {
    int v = E[i].v;
    if (v == fa) continue;
    dep[v] = dep[u] + 1;
    dis[v] = dis[u] + E[i].w;
    dfs(v, u);
    st[++ind][0] = u;
  }
}

int checkmin(int x, int y) {
  return dep[x] < dep[y] ? x : y;
}

void ST() {
  dfs(1, 0);
  for (int i = 2; i <= ind; i++) {
    Log[i] = Log[i >> 1] + 1;
  }
  for (int j = 1; j < LOG; j++) {
    for (int i = 1; i + (1 << j) - 1 <= ind; i++) {
      st[i][j] = checkmin(st[i][j - 1], st[i + (1 << (j - 1))][j - 1]);
    }
  }
}

int lca(int x, int y) {
  x = dfn[x], y = dfn[y];
  if (x > y) swap(x, y);
  int k = Log[y - x + 1];
  return checkmin(st[x][k], st[y - (1 << k) + 1][k]);
}

ll getdis(int x, int y) {
  return dis[x] + dis[y] - dis[lca(x, y)] * 2;
}

}

using LCA::getdis;

namespace Tree_Devide {

struct Node {
  int ch[3], id, siz;
  ll sum[2];
} s[N * LOG];

int siz[N], F[N], dep[N], siz_all, rt, cnt = 0;
int root[N];
bool vis[N];
vector<int> pre[N];

void getroot(int u, int fa) {
  siz[u] = 1;
  F[u] = 0;
  for (int i = head[u]; i; i = E[i].nxt) {
    int v = E[i].v;
    if (v == fa || vis[v]) continue;
    getroot(v, u);
    siz[u] += siz[v];
    F[u] = max(F[u], siz[v]);
  }
  F[u] = max(F[u], siz_all - siz[u]);
  if (F[u] < F[rt]) rt = u;
}

void devide(int u) {
  vis[u] = 1;
  s[u].id = u;
  for (int i = head[u]; i; i = E[i].nxt) {
    int v = E[i].v;
    if (vis[v]) continue;
    F[rt = 0] = siz_all = siz[v];
    getroot(v, 0);
    dep[rt] = dep[u] + 1;
    for (int j : pre[u]) {
      pre[rt].push_back(j);
    }
    for (int j = 0; j < 3; j++) {
      if (s[u].ch[j]) continue;
      s[u].ch[j] = rt;
      pre[rt].push_back(j);
      devide(rt);
      break;
    }
  }
}

void insert(int &t, int las, int u, int fa) {
  t = ++cnt;
  s[t] = s[las];
  s[t].siz++;
  s[t].sum[0] += getdis(s[t].id, u);
  if (fa) {
    s[t].sum[1] += getdis(s[fa].id, u);
  }
  if (s[t].id == u) return;
  insert(s[t].ch[pre[u][dep[s[t].id]]], s[las].ch[pre[u][dep[s[t].id]]], u, t);
}

ll query(int t, int u) {
  ll res = 0;
  for (int i = 0; i < dep[u]; i++) {
    int cur = s[t].ch[pre[u][i]];
    res += (s[t].siz - s[cur].siz) * getdis(s[t].id, u) + s[t].sum[0] - s[cur].sum[1];
    t = cur;
  }
  res += s[t].sum[0];
  return res;
}

void build() {
  F[rt = 0] = siz_all = cnt = m;
  getroot(1, 0);
  root[0] = rt;
  devide(rt);
  for (int i = 1; i <= n; i++) {
    insert(root[i], root[i - 1], a[i], 0);
  }
}

}

using Tree_Devide::root;
using Tree_Devide::build;
using Tree_Devide::insert;
using Tree_Devide::query;

int main() {
  scanf("%d %d", &n, &q);
  m = n;
  for (int i = 1; i <= n; i++) {
    scanf("%d", &a[i]);
  }
  for (int i = 1; i < n; i++) {
    int u, v, w;
    scanf("%d %d %d", &u, &v, &w);
    edge[u].push_back(make_pair(v, w));
    edge[v].push_back(make_pair(u, w));
  }
  rebuild(1, 0);
  LCA::ST();
  build();
  ll lastans = 0;
  while (q--) {
    int op, l, r, u;
    scanf("%d", &op);
    if (op == 1) {
      scanf("%d %d %d", &l, &r, &u);
      l ^= lastans;
      r ^= lastans;
      u ^= lastans;
      lastans = query(root[r], u) - query(root[l - 1], u);
      printf("%lld\n", lastans);
      lastans %= (1 << 30);
    } else {
      scanf("%d", &u);
      u ^= lastans;
      swap(a[u], a[u + 1]);
      insert(root[u], root[u - 1], a[u], 0);
    }
  }
  return 0;
}

Min25 筛法

Posted on 2019-03-24 | In 知识点整理

Min25 筛法

简介

min25 筛法可以解决一类积性函数前缀和的问题

$\sum_{i = 1} ^ n f(i)$

这样的函数需要满足两个个条件才可以用Min25筛法：

函数是积性函数
形如$f(x^k) [x是质数]$的函数值可以快速求出

算法

我们先考虑算出所有质数的$f(x)$函数的和，也就是素数和减去素数个数

首先我们假设需要求出

$\sum_{i = 1} ^ n f(i) [i是质数]$

即小于等于n的素数和

考虑函数$g(n,y)$表示小于等于n的所有数里面是质数或者最小质因子大于$pri_j$的数的和

那么最后需要求出的答案就是$g(n,Psiz)$

考虑g函数怎么转移

当$pri_j^2>n$的时候，显然不会有新的贡献，于是

$g(n, j) = g(n, j - 1)$

否则的话我们把最小质因子是$pri_j$的贡献去掉

$g(n, j) = g(n, j - 1) - f(pri_j)(g(\frac{n}{pri_j}, j - 1) - \sum_{i = 1} ^ {j - 1} f(pri_{i}))$

因为最小质因子小于$pri_j$的情况我们已经统计过了，所以需要把这些情况减掉
我们可以发现这里的f需要满足是完全积性函数

我们现在算出来了所有质数的$f(x)$的和

那么就可以开始算$f(x)$的前缀和了

设$S(n, j)$表示小于等于n的数里面最小质因子大于等于$pri_j$的所有数的函数和

首先考虑所有质数的贡献

$S(n, j) = g(n, Psiz) - \sum_{i = 1} ^ {j - 1} f(pri_i)$

然后枚举和数的最小质因子和其次幂来进行统计

$S(n, j) += \sum_{i = j} ^ {Psiz} \sum_{e = 1} ^ {pri_i^{e + 1} \le n} f(pri_i^e)S(\frac{n}{pri_i^e}, i + 1) + f(pri_i^{e + 1})$

这样的算法复杂度是$\frac{n^{\frac{3}{4}}}{\log(n)}$

一般来说可能比杜教快一点？

适用范围比杜教大一些吧

挺好用的一个算法

斯特林数什么的

Posted on 2019-02-11 | In 知识点整理

斯特林数什么的

定义

第一类strling数

$\begin{bmatrix} n \\ m \end{bmatrix}$表示把$n$个数划分成$m$个环排列的方案数

递推式1

$\begin{bmatrix} n \\ m \end{bmatrix} = \begin{bmatrix} n - 1 \\ m - 1 \end{bmatrix} + \begin{bmatrix} n - 1 \\ m \end{bmatrix} \ast (n - 1)$

枚举最后一个点的位置

递推式2

$\begin{bmatrix} n \\ m \end{bmatrix} = \sum_{i = 1} ^ n\begin{bmatrix} n - i \\ m - 1 \end{bmatrix} \ast (i - 1)! \ast \binom{n - 1}{i - 1}$

枚举最后一个环排列的大小

第二类斯特林数

$\begin{Bmatrix} n \\ m \end{Bmatrix}$表示把$n$个数划分成$m$个无序集合的方案数

递推式1

$\begin{Bmatrix} n \\ m \end{Bmatrix} = \begin{Bmatrix} n - 1 \\ m - 1 \end{Bmatrix}+\begin{Bmatrix} n - 1\\ m \end{Bmatrix} \ast m$

枚举最后一个点的位置

递推式2

$\begin{Bmatrix} n \\ m \end{Bmatrix} = \sum_{i = 1}^n \begin{Bmatrix} n - i\\ m - 1 \end{Bmatrix}\ast \binom{n - 1}{i - 1}$

枚举最后一个集合的大小

特殊表达形式

$\begin{Bmatrix} n \\ m \end{Bmatrix}=\frac{1}{m!}\sum_{k = 0} ^ m (-1)^k \binom{m}{k}(m - k) ^n$

性质

公式1（下降幂转次幂）

$x^{\underline{n}} = \sum_{k = 0} ^ n (-1)^{n - k}\begin{bmatrix} n \\ k \end{bmatrix}x^k$

证明如下：

比较简单，直接考虑怎么算出$x^k$项的系数就可以了，省略

公式2（次幂转下降幂）

$x^n = \sum_{k = 0} ^ n \begin{Bmatrix} n \\ k \end{Bmatrix} x ^ \underline{k}$

也可以转换成组合数和阶乘的形式

$x^n = \sum_{k = 0} ^ n \begin{Bmatrix} n \\ k \end{Bmatrix} \binom{x}{k}k!$

公式3

$\sum_{k=m}^n\begin{bmatrix} n \\ k \end{bmatrix}\begin{Bmatrix} k \\ m \end{Bmatrix}(-1)^{n - k} = [m = n]$

证明如下：

将公式2代入公式1

得到：
$x^{\underline{n}} = \sum_{k = 0} ^ n (-1)^{n - k}\begin{bmatrix} n \\ k \end{bmatrix}\sum_{m = 0} ^ k \begin{Bmatrix} k \\ m \end{Bmatrix} x ^ \underline{m}$
交换和号得：
$x^{\underline{n}} = \sum_{m = 0} ^ n x^{\underline{m}}\sum_{k = m} ^ n (-1)^{n - k}\begin{bmatrix} n \\ k \end{bmatrix} \begin{Bmatrix} k \\ m \end{Bmatrix}$
显然当$n = m$的时候$\sum_{k = m} ^ n (-1)^{n - k}\begin{bmatrix} n \\ k \end{bmatrix} \begin{Bmatrix} k \\ m \end{Bmatrix}$是1

所以有：
$0 = \sum_{m = 0} ^ {n - 1} x^{\underline{m}}\sum_{k = m} ^ n (-1)^{n - k}\begin{bmatrix} n \\ k \end{bmatrix} \begin{Bmatrix} k \\ m \end{Bmatrix}$
因为对于任意的x上面的式子都成立，所以可以得到当$n\not= m$的时候$\sum_{k = m} ^ n (-1)^{n - k}\begin{bmatrix} n \\ k \end{bmatrix} \begin{Bmatrix} k \\ m \end{Bmatrix}$是0

公式4

$\sum_{k=m}^n\begin{Bmatrix} n \\ k \end{Bmatrix}\begin{bmatrix} k \\ m \end{bmatrix}(-1)^{k - m} = [m = n]$

证明如下：

将公式1代入公式2

得到：
$x^{n} = \sum_{k = 0} ^ n \begin{Bmatrix} n \\ k \end{Bmatrix} \sum_{m = 0} ^ k (-1)^{k - m}\begin{bmatrix} k \\ m \end{bmatrix}x^m$
交换和号得：
$x^{n} = \sum_{m = 0} ^ n x^m\sum_{k = m} ^ n \begin{Bmatrix} n \\ k \end{Bmatrix}\begin{bmatrix} k \\ m \end{bmatrix} (-1)^{k - m}$
显然当$n = m$的时候$\sum_{k = m} ^ n \begin{Bmatrix} n \\ k \end{Bmatrix}\begin{bmatrix} k \\ m \end{bmatrix} (-1)^{k - m}$是1

所以有：
$0 = \sum_{m = 0} ^ {n - 1} x^m\sum_{k = m} ^ n \begin{Bmatrix} n \\ k \end{Bmatrix}\begin{bmatrix} k \\ m \end{bmatrix} (-1)^{k - m}$
因为对于任意的x上面的式子都成立，所以可以得到当$n\not= m$的时候$\sum_{k = m} ^ n \begin{Bmatrix} n \\ k \end{Bmatrix}\begin{bmatrix} k \\ m \end{bmatrix} (-1)^{k - m}$是0

ps:

当然$(-1)^{k - m}$和$(-1)^{n - k}$没有任何区别

因为$n - m$是偶数的时候，没有影响

$n - m$是奇数的时候，相当于全体取负，不影响结论

公式5

$\begin{bmatrix} n +1 \\ m + 1 \end{bmatrix} = \sum_{k = m} ^ n \begin{bmatrix} n \\ k \end{bmatrix}\binom{k}{m}$

证明如下：

因为一个环排列对应着一个置换，然后一个置换又可以差分成很多的环排列，所以假设前$n$个数分成了$k$个环排列，并且这k个环排列中有$m$个不变，剩下的$k - m$个和新的环排列组合起来变成一个完整的环排列，也就是第$m+1$个环排列

公式6

$\begin{Bmatrix} n +1 \\ m + 1 \end{Bmatrix} = \sum_{k = m} ^ n \binom{n}{k}\begin{Bmatrix} k \\ m \end{Bmatrix}$

证明如下：

假设不和当前数在同一个集合里面的数是k个，所以这k个数会分成m个集合，然后再用组合数算一算和当前数在一个集合的数的方案数

公式7

$\begin{bmatrix} n + 1\\ m + 1 \end{bmatrix} = \sum_{k = m} ^ n\begin{bmatrix} k\\ m \end{bmatrix}(\frac{n!}{k!}或n^{\underline{n - k}})$

其实就是第一类斯特林数的递推式2的化简版本，组合意义一模一样

公式8

$\begin{Bmatrix} n + 1\\ m + 1 \end{Bmatrix} = \sum_{k = m} ^ n\begin{Bmatrix} k\\ m \end{Bmatrix}(m+1)^{n - k}$

证明如下：

考虑第k+1个数是第一个被放进第m+1个集合中的数

所以前k个数会被放进m个集合中，并且还有$(m+1)^{n - k}$个数可以随便放

公式9（斯特林反演）

对于：

$g(n) = \sum_{k = 0} ^ n(-1)^{n - k}\begin{bmatrix} n\\ k \end{bmatrix}f(k)$

有：

$f(n) = \sum_{k = 0} ^ n \begin{Bmatrix} n \\ k \end{Bmatrix} g(k)$

反之亦然

证明可以直接带入然后用公式3和公式4进行理解

简单运用

第一类斯特林数求行方法

假设需要求第一类斯特林数第n行

首先有：

$x^{\overline{n}} = \sum_{i = 0} ^ n \begin{bmatrix}n \\ i\end{bmatrix}x^i$

就是下降幂换成上升幂，过程不变是是没有符号了，和公式1同理

那么也就是说$x^{\overline{n}}$是第n行斯特林数的生成函数

然后可以用$O(n\log^2 n)$的时间分治fft来算

也可以用$O(n\log n)$的倍增算法

$f_{2n}(x) = x^{\overline{2n}} = f_n(x)f_n(x + n)$

然后$f_n(x+n)$实际上就是把$f_n(x)$的各项$x^k$换成$(x+n)^k$

可以用二项式系数展开并且用$O(n\log n)$时间卷积求出

第二类斯特林数求行方法

实际上就是第二类斯特林数的特殊表达形式

发现没有其实这是一个卷积：

$\begin{Bmatrix} n \\ m \end{Bmatrix}=\frac{1}{m!}\sum_{k = 0} ^ m (-1)^k \binom{m}{k}(m - k) ^n$

然后可以直接卷积算出来了

递归式的一般求解方法

Posted on 2019-01-31 | In 学习笔记

递归式的一般求解方法

对于一个通用的递归式模式

$f(i)=a_i (1\le j < d); \\ f(dn+i)=cf(n)+\beta_i(0\le j < d, 1\le n)$

我们于是可以把$n$用$d$进制表示出来

$n = (b_mb_{m-1}...b_{1}b_{0})_d$

然后把答案用$c$进制表示出来

$f(n)=(a_{b_m}\beta_{b_{m - 1}}\beta_{b_{m - 2}}...\beta_{b_{1}}\beta_{b_{0}})_c$

即：

$f((b_mb_{m-1}...b_{1}b_{0})_d)=(a_{b_m}\beta_{b_{m - 1}}\beta_{b_{m - 2}}...\beta_{b_{1}}\beta_{b_{0}})_c$

或者，可以把独立的系数给拆开考虑，比如变成如下形式：

$f(n)=\alpha A(n)+\beta B(n)+\gamma C(n)+\delta D(n)+...$

然后根据f函数的特殊性质或者特殊的n来进行推导

参考笔记

多项式运算

Posted on 2019-01-06 | In 知识点整理

多项式运算

本文所讲所有的多项式运算全部基于vector的使用

1	typedef vector<int> Poly;

0.思想

自认为多项式最重要的思想就是倍增了

其次就是分治

建议先看看fft残疾人手册和ntt残疾人手册

1.多项式加法

$C(n)=A(n)+B(n)$

就是系数相加，非常简单的实现

Poly add(Poly a, Poly b) {
  a.resize(max(a.size(), b.size()));
  for (size_t i = 0; i < b.size(); i++)
    a[i] = add(a[i], b[i]);
  return a;
}

2.多项式减法

$C(n)=A(n)-B(n)$

系数相减，依旧简单的实现

Poly sub(Poly a, Poly b) {
  a.resize(max(a.size(), b.size()));
  for (size_t i = 0; i < b.size(); i++)
    a[i] = sub(a[i], b[i]);
  return a;
}

3.多项式乘法

$C(n)=\sum_{i=0}^nA(i)B(n-i)$

就是ntt

需要预处理原根的次幂

交换位置的时候动态处理就好，因为在倍增过程中ntt的长度不一样

int w[2][N];

void init() {
  for (int i = 1; i < (1 << 18); i <<= 1) {
    w[1][i] = w[0][i] = 1;
    int wn;
    wn = fast_pow(G, (Mod - 1) / (i << 1));
    for (int j = 1; j < i; j++) 
      w[1][i + j] = mul(wn, w[1][i + j - 1]);
    wn = fast_pow(G, Mod - 1 - (Mod - 1) / (i << 1));
    for (int j = 1; j < i; j++)
      w[0][i + j] = mul(wn, w[0][i + j - 1]);
  }
}

void transform(int *t, int len, int typ) {
  for (int i = 0, j = 0, k; j < len; j++) {
    if (j > i) swap(t[i], t[j]);
    for (k = (len >> 1); k & i; k >>= 1) i ^= k;
    i ^= k;
  }
  for (int i = 1; i < len; i <<= 1) {
    for (int j = 0; j < len; j += (i << 1)) {
      for (int k = 0; k < i; k++) {
        int x = t[j + k], y = mul(t[j + k + i], w[typ][i + k]);
        t[j + k] = add(x, y);
        t[j + k + i] = sub(x, y);
      }
    }
  }
  if (typ) return;
  int inv = fast_pow(len, Mod - 2);
  for (int i = 0; i < len; i++)
    t[i] = mul(t[i], inv);
}

Poly mul(const Poly &a, const Poly &b) {
  int len = a.size() + b.size() + 1;
  len = 1 << (int) ceil(log2(len));
  static Poly prea, preb;
  prea = a;
  preb = b;
  prea.resize(len);
  preb.resize(len); 
  transform(&prea[0], len, 1);
  transform(&preb[0], len, 1); 
  for (int i = 0; i < len; i++)
    prea[i] = mul(prea[i], preb[i]);
  transform(&prea[0], len, 0);
  clean(prea);
  return prea;
}

4.多项式求逆

对于多项式$A$，我们要求出$B$

满足$A\ast B=1(\mod x^{n+1})$

这里的$\mod x^n$是保留前$n+1$个系数的意思，不然$B(n)$会有无穷项

我们假设已经求出了$B’$满足$A\ast B’=1(\mod x^{\lceil\frac{n}{2}\rceil})$

那么因为存在$A\ast B=1(\mod x^{\lceil\frac{n}{2}\rceil})$

所以$A\ast (B-B’)=0(\mod x^{\lceil\frac{n}{2}\rceil})$

又因为A不是0，所以$(B-B’)=0(\mod x^{\lceil\frac{n}{2}\rceil})$

两边同时平方（模数也要平方）

$B^2-2\ast B\ast B’+B’^2=0(\mod x^n)$

因为有个$B^2$不好计算，所以把等式两边同时乘上$A$

得到$B-2\ast B’+A\ast B’^2=0(\mod x^n)$

即$B=2\ast B’-A\ast B’^2(\mod x^n)$

这样就可以递归求解了

Poly inv(Poly a, int n) {
  if (n == 1) return Poly(1, fast_pow(a[0], Mod - 2));
  int len = 1 << ((int) ceil(log2(n)) + 1);
  Poly x = inv(a, (n + 1) >> 1), y;
  x.resize(len);
  y.resize(len);
  for (int i = 0; i < n; i++)
    y[i] = a[i];
  transform(&x[0], len, 1);
  transform(&y[0], len, 1);
  for (int i = 0; i < len; i++)
    x[i] = mul(x[i], sub(2, mul(x[i], y[i])));
  transform(&x[0], len, 0);
  x.resize(n);
  return x;
}

Poly inv(Poly a) {
  return inv(a, a.size());
}

5.多项式除法

对于n次多项式$A$和m次多项式$B$，构造出小于n-m次多项式$C$和小于m次的多项式$D$

满足$A=B*C+D$

我们考虑一下多项式$A$的系数反转形式记做$RevA$

所以$RevA(x)=x^nA(\frac{1}{x})$

我们把原来的式子左右同时乘上$x^n$

得到$A(\frac{1}{x})\ast x^n=B(\frac{1}{x})\ast C(\frac{1}{x})\ast x^n+D(\frac{1}{x})\ast x^n$

所以$RevA(x)=RevB(x)\ast RevC(x)+x^{n-m+1}RevD(x)$

在$\mod x^{n-m+1}$的意义下发现$RevD$就没了，然而并不影响$RevA,RevB,RevC$

所以我们只需要求出$RevB$在$\mod x^{n-m+1}$意义下的逆元，然后就可以算出$RevC$和$RevD$

Poly rev(Poly a) {
  clean(a);
  reverse(a.begin(), a.end());
  return a;
}

void div(Poly a, Poly b, Poly &c, Poly &d) {
  int n = a.size(), m = b.size();
  Poly ra = rev(a), rb = rev(b);
  ra.resize(n - m + 1);
  rb.resize(n - m + 1);
  c = mul(ra, inv(rb));
  c.resize(n - m + 1);
  c = rev(c);  
  d = sub(a, mul(b, c));
  clean(c), clean(d);
}

6.多项式求导

因为多项式的形式很简单，所以求导直接可以模拟出来

Poly deri(Poly a) {
  int n = a.size();
  for (int i = 1; i < n; i++)
    a[i - 1] = mul(a[i], i);
  a.resize(n - 1);
  return a;
}

7.多项式积分

积分也直接模拟吧。。

Poly inte(Poly a) {
  int n = a.size();
  a.resize(n + 1);
  for (int i = n; i >= 1; i--)
    a[i] = mul(a[i - 1], fast_pow(i, Mod - 2));
  a[0] = 0;
  return a;
}

8.多项式对数函数

对于n次多项式$A$我们需要求出n次多项式$B$满足$B=\ln(A)$

两边同时求导

$B’=\frac{A’}{A}$

所以把$A$的导和逆乘起来然后积分回去就可以了。。

Poly ln(Poly a) {
  int len = a.size();
  a = inte(mul(deri(a), inv(a)));
  a.resize(len);
  return a;
}

9.多项式指数函数

对于n次多项式$A$我们需要求出来n次多项式$B$满足$B=e^A$

所以$\ln(B)=A $

然后我们构造一个函数$F(B)=\ln(B)-A$

我们要求函数$F(A)=0$的时候的解

根据泰勒展开和牛顿迭代：

$f(x)=f(x_0)+f’(x_0)(x-x_0)$

我们可以得到迭代公式：$x=x_0-\frac{f(x_0)}{f’(x_0)}$

对应到求exp上面来：$B=B_0-\frac{F(B_0)}{F’(B_0)}$

展开得到：$B=B_0-\frac{\ln(B_0)-A}{\frac{1}{B_0}}=B_0(1-\ln(B_0)+A)$

然后就可以根据上面的这个式子进行倍增，因为每一次计算长度会变成原来的两倍

Poly exp(Poly a, int n) {
  if (n == 1) return Poly(1, 1);
  Poly x = exp(a, (n + 1) >> 1), y;
  x.resize(n);
  y = ln(x);
  for (int i = 0; i < n; i++)
    y[i] = sub(a[i], y[i]);
  y[0]++;
  x = mul(x, y);
  x.resize(n);
  return x;
}

Poly exp(Poly a) {
  return exp(a, a.size());
}

10.多项式开根

给定n次多项式$A$，求$B$满足$B^2=A(\mod x^{n+1})$

和求exp的思路比较类似，同样用到了牛顿迭代法

构造函数$F(B)=B^2-A$，求$F(B)=0$的解

带入迭代公式：$x=x_0-\frac{f(x_0)}{f’(x_0)}$

得到$B=B_0-\frac{B_0^2-A}{2B_0}=\frac{B_0^2+A}{2B_0}=\frac{1}{2}\ast (B_0+\frac{A}{B_0})$

依旧是倍增进行求解

Poly sqrt(Poly a, int n) {
  if (n == 1) return Poly(1, 1);
  Poly x = sqrt(a, (n + 1) >> 1), y;
  x.resize(n);
  y.resize(n);
  for (int i = 0; i < n; i++)
    y[i] = a[i];
  x = add(mul(inv(x), y), x);
  int inv2 = fast_pow(2, Mod - 2);
  for (int i = 0; i < n; i++)
    x[i] = mul(x[i], inv2);
  x.resize(n);
  return x;
}

Poly sqrt(Poly a) {
  return sqrt(a, a.size());
}

莫比乌斯反演和杜教筛

Posted on 2019-01-06 | In 知识点整理

莫比乌斯反演和杜教筛

0.数论函数

数论函数是莫比乌斯反演和杜教筛的前置知识

0.定义

数论函数：定义域是正整数的函数
积性函数：对于任意两个互质的正整数$a,b$，满足$f(ab)=f(a)f(b)$的函数
完全积性函数：对于任意两个正整数$a,b$，满足$f(ab)=f(a)f(b)$的函数

1.常见积性函数

1.单位函数

非常简单的定义：$e(n)=[n=1]$

2.常函数

也很简单的定义：$1(n)=1$

3.恒等函数

依旧简单的定义：$id(n)=n$

4.莫比乌斯函数

莫比乌斯函数$\mu(n)$，当n有平凡因子的时候值是$0$，否则就是$(-1)^{质因子个数}$，即：

$\mu(n)=\begin{cases} 1\ (n=1) \\ -1^k\ (n有k个质因子且没有平方因子) \\ 0\ (n有平方因子) \end{cases}$

莫比乌斯函数的性质：

$\sum_{i|n}\mu(i)=[n=1]$

5.欧拉函数

欧拉函数$\phi(n)$的定义是$[1,n]$中和n互质的数的个数

假设集合$P$包含了所有n的质因子，那么有：

$\phi(i)=n\prod_{p\in P}\frac{p-1}{p}$

欧拉函数的性质：

$\sum_{i|n}\phi(i)=n$ $若n\not=1,\sum_{i=1}^ni[(i,n)=1]=\frac{n\phi(n)}{2}(i)$

2.Dirichlet卷积

对于两个数论函数$f(n),g(n)$，定义Dirichlet卷积为：

$(f*g)(n)=\sum_{d|n}f(d)g(\frac{n}{d})$

并且Dirichlet卷积满足交换律、结合律和分配率，即：

$f*g=g*f \\ f*(g*h)=(f*g)*h \\ f*(g+h)=f*g+f*h$

由Dirichlet卷积我们可以推导出：

如果函数$f,g$都是积性函数，那么$f*g$也是积性函数

如果我们无法快速（在$n\log(n)$以内）求出$f\ast g$

那么我们就可以用$O(n\log((n))$的时间求出我们想要的$f\ast g $

可以这样处理：

typedef vector<int> Poly;
Poly Dirichlet(Poly f, Poly g) {
  int len = f.size();
  Poly h(len);
  for (int i = 1; i * i < len; i++) {
    for (int j = i; j * i < len; j++) {
      if (i == j) h[i * j] += f[i] * g[j];
      else h[i * j] += f[i] * g[j] + f[j] * g[i];
    }
  }
  return h;
}

1.莫比乌斯反演

1.莫比乌斯恒等式

如果两个函数$f, g $，满足

$f(n)=\sum_{d|n}g(d)$

那么有：

$g(n)=\sum_{d|n}f(d)\mu(\frac{n}{d})$

也可以表示成：

$g(n)=\sum_{n|d}f(d)\mu(\frac{d}{n})$

但是后面这种形式应该不太常用

证明很简单，我们其实就是要证明：

$f=g\ast1$和$g=f \ast\mu$是等价的

证明其实很简单，第一个式子两边同时卷上$\mu$或者第二个式子两边同时卷上$1$

2.使用技巧

注意在Mobius反演的时候有几种常用技巧：

交换和号
根号分块（下底函数分块）
添加性质良好便于计算的积性函数

2.杜教筛

杜教筛，很方便，但是有其局限性

一般情况是我们需要计算一个积性函数$f$的前缀和：

$Sum(n)=\sum_{i=1}^nf(i)$

于是我们可以构造一个有良好特殊性质的积性函数$g$，使得$f\ast g$可以快速算出并具有一定性质

然后我们可以快速算出：

$\sum_{i=1}^n\sum_{d|i}g(d)f(\frac{i}{d})$

把上面的式子交换一下和号得到：

$\sum_{d=1}^n g(d)\sum_{i=1}^{\lfloor\frac{n}{d}\rfloor}f(i)$

就变成了：

$\sum_{d=1}^n g(d)Sum(\lfloor\frac{n}{d}\rfloor)$

也就是说：

$Sum(n)+\sum_{d=2}^n g(d)Sum(\lfloor\frac{n}{d}\rfloor)=\sum_{i=1}^n\sum_{d|i}g(d)f(\frac{i}{d})$

所以：

$Sum(n)=\sum_{i=1}^n\sum_{d|i}g(d)f(\frac{i}{d})-\sum_{d=2}^n g(d)Sum(\lfloor\frac{n}{d}\rfloor)$

我们发现上面的这个式子右边的部分，一个可以快速计算，一个可以根号分块递归成子问题

注意我们需要用线性筛预处理一部分前缀和大概$O(n^{\frac{2}{3}})$个，这样时间效率是$O(n^{\frac{2}{3}})$的

常数比较大，主要是需要map来对ll值和前缀和进行映射

例题：

题目大意：

定义神树集是一个二维平面上的点集，使得存在至少一条直线恰好经过两个点

求$x\in[0,n],y\in[0,n]$的神树集个数$\mod 12345678$

思路：

首先有一个结论：只有点数小于2或者所有点共线的点集不是神树集

那我们就把这一部分答案容斥掉就可以了

首先我们可以枚举两个端点的横纵坐标差然后进行统计（这里没有统计平行坐标轴的）

$sum=2*[\sum_{x=1}^n\sum_{y=1}^n2^{(x,y)-1}(n+1-x)(n+1-y)]$

其中$(n+1-x)(n+1-y)$是可以选择的左边端点的数量

然后我们枚举gcd

$sum=\sum_{g=1}^n2^g\sum_{x=1}^{\lfloor\frac{n}{g}\rfloor}\sum_{y=1}^{\lfloor\frac{n}{g}\rfloor}(n-1-gx)(n+1-gy)[(x,y)=1]$

然后把后面拆开按照g的次数分类

变成了

$sum=\sum_{g=1}^n(n+1)^2(2^g)F(\frac{n}{g})+(n+1)(2^gg)G(\frac{n}{g})+(2^gg^2)H(\frac{n}{g})$

其中

$F(n)=\sum_{x=1}^n\sum_{y=1}^n[(x,y)=1]=[2\sum_{i = 1}^n\phi(i)]-1$ $G(n)=\sum_{x=1}^n\sum_{y=1}^n(x+y)[(x,y)=1]$

因为我们有：

$\sum_{i=1}^ni[(i,n)=1]=\frac{n\phi(n)}{2} (n!=1)$

所以可以对$G(n)$进行化简，把x和y的贡献分别来看，得到：

$G(n)=[3\sum_{i=1}^ni\phi(i)]-1$

同理，我们也可以对$H(n)$进行化简

$H(n)=\sum_{i=1}^ni^2\phi(i)$

至于有关$i=1$的细节问题，请自行自习思考

然后发现$\sum_{i=1}^n\phi(i),\sum_{i=1}^ni\phi(i),\sum_{i=1}^ni^2\phi(i) $都是可以用杜教筛算出来的

然后$\sum_{i=1}^n 2^i, \sum_{i=1}^n 2^ii,\sum_{i=1}^n 2^i i^2$都是可以用做差法在$O(\log n)/O(1)$的时间内算出来的

到这里我们已经完成了一大部分

剩下的就是对还没有讨论的情况进行分析

首先因为我们要算的是不合法情况，所以应该去掉被包含合法的两个点的个数

因此我们需要算出不和坐标轴平行的两个点点集的个数

所有点对个数是$\frac{(n+1)^2((n+1)^2-1)}{2}$，去掉与坐标轴平行的个数是$2(n+1)\frac{(n+1)n}{2}=(n+1)^2n$
其次因为在与坐标轴平行的情况中，点数大于2的情况我们没有减去

这一部分的情况实际上我们只用考虑$2(n+1)$个单独的行就可以了

对于每一行我们用所有的方案数减去小于3的方案数

就是$2^{n+1}-\frac{n(n+1)}{2}-(n+1)-1$
最后是所有方案数中点数小于2的也不合法，一共有$(n+1)^2+1$种

然后就直接用总的方案数$2^{(n+1)^2}$种减去不合法的就可以了

注意一下$2^{(n+1)^2}$快速幂的时候指数不能直接取mod

并且还有一堆恶心的地方需要分类讨论，因为模数真的很奇葩

#include<bits/stdc++.h>

using namespace std;

typedef long long ll;

const ll N = 5e6 + 10;
const ll Mod = 12345678;

ll add(ll a, ll b) {
  return (a + b) % Mod;
}

ll sub(ll a, ll b) {
  return ((a - b) % Mod + Mod) % Mod;
}

ll mul(ll a, ll b) {
  if (a > Mod) a %= Mod;
  if (b > Mod) b %= Mod;
  return a * b % Mod;
}

ll fast_pow(ll a, ll b) {
  ll res = 1;
  for (; b; b >>= 1, a = mul(a, a))
    if (b & 1) res = mul(res, a);
  return res;
}

struct Node {
  ll f, g, h;
} sum[N];
map<ll, Node> mp;

ll n, tot, pri[N], phi[N];
bool vis[N];

void getprime() {
  ll limit = min(n, N - 1); 
  phi[1] = 1;
  for (ll i = 2; i <= limit; i++) {
    if (!vis[i]) {
      phi[i] = i - 1;
      pri[++tot] = i;
    }
    for (ll j = 1; j <= tot && pri[j] * i <= limit; j++) {
      vis[i * pri[j]] = 1;
      if (i % pri[j] == 0) {
        phi[i * pri[j]] = phi[i] * pri[j];
        break;
      } else {
        phi[i * pri[j]] = phi[i] * (pri[j] - 1);
      }
    }
  }
  for (ll i = 1; i < N; i++) {
    sum[i].f = add(sum[i - 1].f, phi[i]);
    sum[i].g = add(sum[i - 1].g, mul(i, phi[i]));
    sum[i].h = add(sum[i - 1].h, mul(mul(i, i), phi[i]));
  }
}

ll geta(ll x) {
  if (x & 1) {
    return mul(x, (x + 1) / 2);
  } else {
    return mul(x / 2, x + 1);
  } 
}

ll getb(ll x) {
  if (x % 6 == 0) {
    return mul(x / 6, mul(x + 1, 2 * x + 1));
  } else if (x % 6 == 1) {
    return mul(x, mul((x + 1) / 2, (2 * x + 1) / 3));
  } else if (x % 6 == 2) {
    return mul(x / 2, mul((x + 1) / 3, 2 * x + 1)); 
  } else if (x % 6 == 3) {
    return mul(x / 3, mul((x + 1) / 2, 2 * x + 1));
  } else if (x % 6 == 4) {
    return mul(x / 2, mul(x + 1, (2 * x + 1) / 3));
  } else {
    return mul(x, mul((x + 1) / 6, 2 * x + 1));
  }
}

Node solve(ll x) {
  if (x < N) return sum[x];
  if (mp.count(x)) return mp[x];
  ll pref = geta(x), preg = getb(x), preh = mul(pref, pref);
  for (ll i = 2; i <= x; i++) {
    ll j = x / (x / i);
    Node cur = solve(x / i);
    pref = sub(pref, mul(j - i + 1, cur.f));
    preg = sub(preg, mul(sub(geta(j), geta(i - 1)), cur.g));
    preh = sub(preh, mul(sub(getb(j), getb(i - 1)), cur.h));
    i = j;
  }
  return mp[x] = (Node) {pref, preg, preh};
}

ll calcf(ll x) {
  return fast_pow(2, x + 1);
}

ll calcf(ll l, ll r) {
  return sub(calcf(r), calcf(l - 1));
}

ll calcg(ll x) {
  return mul(x - 1, calcf(x)); 
}

ll calcg(ll l, ll r) {
  return sub(calcg(r), calcg(l - 1));
}

ll calch(ll x) {
  return add(sub(mul(mul(x, x), calcf(x)), 2 * calcg(x)), calcf(x));
}

ll calch(ll l, ll r) {
  return sub(calch(r), calch(l - 1));
}

 main() {
  scanf("%lld", &n);
  getprime();
  ll resf = 0, resg = 0, resh = 0;
  for (ll i = 1; i <= n; i++) {
    ll j = n / (n / i);
    Node cur = solve(n / i);
    resf = add(resf, mul(calcf(i, j), 2 * cur.f - 1));
    resg = add(resg, mul(calcg(i, j), 3 * cur.g - 1));
    resh = add(resh, mul(calch(i, j), cur.h));
    i = j;
  }
  ll ans = add(sub(mul(mul(n + 1, n + 1), resf), mul(n + 1, resg)), resh);
  ans = sub(ans, mul(mul(n + 1, n + 2), geta(n)));
  ans = add(ans, mul(mul(n + 1, n + 1), n));
  ans = add(ans, mul(n * 2 + 2, sub(fast_pow(2, n + 1), add(n + 2, geta(n)))));
  ans = sub(sub(fast_pow(fast_pow(2, n + 1), n + 1), mul(n + 1, n + 1) + 1), ans); //指数不能直接取模 
  printf("%lld", ans);
  return 0;
}

NTT残疾人手册

Posted on 2018-12-15 | Edited on 2019-01-06 | In 知识点整理

NTT残疾人手册

建议先阅读FFT的残疾人手册

0.简介

首先fft的计算方式是在实数域下进行运算的

所以难免会有精度误差，但是如果我们需要在模的意义下快速求多项式的卷积FFT就失灵了

因此NTT就出现了

1.原根的介绍

关于单位根的性质回顾

我们需要一个在模意义下成立的具有单位根性质的东西

那么单位根的性质我们用到了哪一些呢？

$\omega_n^0\not= \omega_n^1\not= \cdots\not= \omega_n^{n-1}$ $\omega_{n}^k=\omega_{\frac{n}{2}}^{\frac{k}{2}}$ $\omega_{n}^k=\omega_{n}^{k \% n}$ $\omega_{n}^{k+\frac{n}{2}}=-\omega_{n}^k$ $\sum_{k=0}^{n-1} (\omega_n^{j-i})^k = n[i=j]$

原根概念的引入

模数Mod的原根g的定义是需要满足：

$g^0\not= g^1\not= \cdots\not= g^{p-2} \pmod {Mod}$

而模数Mod定要满足是质数且可以表示成$Mod = k\cdot2^r+1$的形式

在这种情况下令$g_n=g^k\pmod {Mod}$

就可以使得：

$g_n^0\not= g_n^1\not= \cdots\not= g_n^{n-1} \pmod {Mod}$

这样的话，我们就可以用原根来代替单位根进行模意义下的快速变换了

主要过程和fft没有本质区别

FFT残疾人手册

Posted on 2018-12-14 | Edited on 2019-01-08 | In 知识点整理

FFT残疾人手册

0.简介

FFT/NTT可以把本来复杂度是$\mathcal O(n^2)$的多项式乘法优化成$\mathcal O(n\log n)$的复杂度

在比较高等级的比赛中会用吧

在电脑上存一个板子也挺方便的

1.点值表示法

一个$n$次多项式

$A(x)=\sum_{i=0}^{n-1}a_ix^i$

的点值表示法为

$<(x_0,y_0),(x_1,y_1),...,(x_{n-1},y_{n-1})>$

其实就是把$x_0,x_1,…,x_{n-1}$代入$A(x)$中得到的$y_0,y_1,…,y_{n-1}$

一个大小为$n$点值表示法可以唯一确定一个$n$次多项式

因为点值表示法实际上就是n个方程

$A(x_0)=y_0 \\ A(x_1)=y_1 \\ ... \\ A(x_{n-1})=y_{n-1}$

这样是可以唯一确定系数集合$a_0,a_1,…,a_{n-1}$的

2.算法的主要思想

我们把多项式$A(x),B(x)$在$x_0,x_1,…,x_{2n-2}$处的点值分别求出来，得到

$<(x_0,A_0),(x_1,A_1),...,(x_{2n-2},A_{2n-2})> \\ <(x_0,B_0),(x_1,B_1),...,(x_{2n-2},B_{2n-2})>$

把这些点值乘起来变成

$<(x_0,A_0*B_0),(x_1,A_1*B_1),...,(x_{2n-2},A_{2n-2}*B_{2n-2})>$

就可以还原成多项式$A(x)*B(x)$

3.前置知识：单位根

给没有复数基础知识的OIer普及一下：$i=\sqrt{-1}$，是一个常数

然后形如$cos(\theta)+i\cdot sin(\theta)$的复数有一个很好的性质

$(cos(\theta)+i\cdot sin(\theta))^k=cos(k\theta)+i\cdot sin(k\theta)$

这个东西可以用数学归纳法暴力展开证明

n次单位根是形如$cos(\frac{2\pi k}{n})+i\cdot sin(\frac{2\pi k}{n})$的复数

我们记$\omega_{n}=cos(\frac{2\pi}{n})+i\cdot sin(\frac{2\pi}{n})$

然后有$\omega_n^k=cos(\frac{2\pi k}{n})+i\cdot sin(\frac{2\pi k}{n})$

所以说n次单位根其实就是把单位元分成了n等份

根据这个性质很容易得到

$\omega_{n}^k=\omega_{\frac{n}{2}}^{\frac{k}{2}}$

也就是说存在：

$(\omega_n^k)^2=\omega_{\frac{n}{2}}^k$

根据三角函数的周期性可以得到一个式子：

$\omega_n^k=cos(\frac{2\pi ki}{n})+i\cdot sin(\frac{2\pi k}{n})=cos(\frac{2\pi(k\%n)}{n})+i\cdot sin(\frac{2\pi(k\%n)}{n})=\omega_n^{k\%n}$

结合$(7)(8)$可以得到：

$(\omega_n^k)^2=(\omega_n^{k+\frac{n}{2}})^2=\omega_{\frac{n}{2}}^{k}$

还有一个很好的性质：

$\omega_n^{\frac{n}{2}+k}=\omega_n^k \cdot \omega_n^{\frac{n}{2}}= \omega_n^k \cdot e^{\frac{2\pi i}{n}\cdot\frac{n}{2}} = \omega_n^k\cdot e^{\pi i} = - \omega_n^k$

第$(9)$和$(10)$个式子都是我们要用到重要性质

4.DFT过程及其优化

DFT就是所谓的离散傅里叶变换（Discrete Fourier Transform, DFT）

因为朴素的多项式转化成点值的复杂度是$n^2$的，很慢

所以考虑怎么把这个东西优化下来

首先DFT的优化用到了分治的思想

根据第$(9)$个式子，我们来猜想一些性质

多项式：

$A(x)=\sum_{i=0}^{n-1}a_ix^i$

把A的所有项按照x指数的奇偶性来分类变成

$A(x)=(a_0x^0+a_2x^2+a_4x^4...)+(a_1x^1+a_3x^3+a_5x^5...)$

令：

$F(x)=a_0x^0+a_2x^1+a_4x^2... \\ G(x)=a_1x^0+a_3x^1+a_5x^2...$

所以有：

$A(x)=F(x^2)+xG(x^2)$

那么$A(x)$就变成了$F(x)$在$x^2$处的点值和$G(x)$在$x^2$处的点值和x的积之和

在取x集合的时候令：

$x_0=\omega_{n}^0 \\ x_1=\omega_{n}^1 \\ ... \\ x_{n-1}=\omega_{n}^{n-1}$

就可以得到：

$A(\omega_{n}^k)=F(\omega_{\frac{n}{2}}^k)+\omega_{n}^kG(\omega_{\frac{n}{2}}^k) \\ A(\omega_{n}^{k+\frac{n}{2}})=F(\omega_{\frac{n}{2}}^k)-\omega_{n}^kG(\omega_{\frac{n}{2}}^k)$

这样的话我们只需要计算出$F(x)$和$G(x)$的值就可以算出多项式$A(x)$的点值了

而因为每次我们递归的时候都会缩小一半的计算范围，只不过需要预先把n补到2的次幂

所以这样的时间复杂度是：

$\mathcal T(n) = 2\mathcal T(\frac{n}{2})+\mathcal O(n) = \mathcal O(n\log n)$

5.IDFT过程及其优化

我们做完了DFT，现在需要用点值还原出多项式

也就是说要从这个有n个等式的线性方程组：

$\begin{equation*} \left\{ \begin{array}{ccccccccc} a_0(\omega_n^0)^{0}&+&\cdots&+&a_{n-2}(\omega_n^0)^{n-2}&+&+a_{n-1}(\omega_n^0)^{n-1}&=&A(\omega_n^0) \\ a_0(\omega_n^1)^{0}&+&\cdots&+&a_{n-2}(\omega_n^1)^{n-2}&+&+a_{n-1}(\omega_n^1)^{n-1}&=&A(\omega_n^1) \\ \vdots & & \vdots & &\vdots& & \vdots & & \vdots\\ a_0(\omega_n^{n-1})^{0}&+&\cdots&+&a_{n-2}(\omega_n^{n-1})^{n-2}&+&+a_{n-1}(\omega_n^{n-1})^{n-1}&=&A(\omega_n^{n-1}) \end{array} \right. \end{equation*}$

解出$a_0,a_1,…a_{n-1}$的值。

我们把上面的线性方程组写成矩阵形式，发现是：

$\begin{equation} \label{IDFT-equation} \begin{bmatrix} (\omega_n^0)^0 & (\omega_n^0)^1 & \cdots & (\omega_n^0)^{n-1} \\ (\omega_n^1)^0 & (\omega_n^1)^1 & \cdots & (\omega_n^1)^{n-1} \\ \vdots & \vdots & \ddots & \vdots \\ (\omega_n^{n-1})^0 & (\omega_n^{n-1})^1 & \cdots & (\omega_n^{n-1})^{n-1} \end{bmatrix} \begin{bmatrix} a_0 \\ a_1 \\ \vdots \\ a_{n-1} \end{bmatrix} = \begin{bmatrix} A(\omega_n^0) \\ A(\omega_n^1) \\ \vdots \\ A(\omega_n^{n-1}) \end{bmatrix} \end{equation}$

也就是说我们要求出矩阵

$P=\begin{bmatrix} (\omega_n^0)^0 & (\omega_n^0)^1 & \cdots & (\omega_n^0)^{n-1} \\ (\omega_n^1)^0 & (\omega_n^1)^1 & \cdots & (\omega_n^1)^{n-1} \\ \vdots & \vdots & \ddots & \vdots \\ (\omega_n^{n-1})^0 & (\omega_n^{n-1})^1 & \cdots & (\omega_n^{n-1})^{n-1} \end{bmatrix}$

的逆矩阵$P’$。

在这里直接给出逆矩阵$P’$并证明一定成立

$P'=\frac{1}{n}\left[\begin{matrix} (\omega_n^{-0})^0 & (\omega_n^{-0})^1 & \cdots & (\omega_n^{-0})^{n-1} \\(\omega_n^{-1})^0 & (\omega_n^{-1})^1 & \cdots & (\omega_n^{-1})^{n-1} \\ \vdots & \vdots & \ddots & \vdots \\ (\omega_n^{-(n-1)})^0 &(\omega_n^{-(n-1)})^1 & \cdots & (\omega_n^{-(n-1)})^{n-1} \\\end{matrix}\right]$

那么对于矩阵$Q=PP’$，有$Q_{i,j}=\sum_{k=0}^{n-1}P_{i,k}\cdot P’_{k,j}$

即$Q_{i,j}=\sum_{k=0}^{n-1}\frac{1}{n}\omega_n^{-ik}\cdot \omega_n^{kj}=\frac{1}{n}\sum_{k=0}^{n-1}(\omega_n^{j-i})^k $

$i\not=j$：$Q_{i,j}=\frac{1}{n}\sum_{k=0}^{n-1}(\omega_n^{i-j})^k=\frac{1}{n}\cdot \frac{(\omega_n^{i-j})^n-1}{\omega_n^{i-j}-1}$

因为公式$(8)$，可以得到$(\omega_n^{i-j})^n=1$，所以$Q_{i,j}=0$
$i=j$：$Q_{i,j}=1$

所以$P$和$P’$互为逆矩阵

也就是说现在要做的就是求出$P’$和点值矩阵的乘积，即：

$\frac{1}{n}\left[\begin{matrix} (\omega_n^{-0})^0 & (\omega_n^{-0})^1 & \cdots & (\omega_n^{-0})^{n-1} \\(\omega_n^{-1})^0 & (\omega_n^{-1})^1 & \cdots & (\omega_n^{-1})^{n-1} \\ \vdots & \vdots & \ddots & \vdots \\ (\omega_n^{-(n-1)})^0 &(\omega_n^{-(n-1)})^1 & \cdots & (\omega_n^{-(n-1)})^{n-1} \\\end{matrix}\right] \begin{bmatrix} A(\omega_n^0) \\ A(\omega_n^1) \\ \vdots \\ A(\omega_n^{n-1}) \end{bmatrix}$

再来观察一下原来的DFT过程中我们做的事，就是求出了

$\left[\begin{matrix} (\omega_n^{0})^0 & (\omega_n^{0})^1 & \cdots & (\omega_n^{0})^{n-1} \\(\omega_n^{1})^0 & (\omega_n^{1})^1 & \cdots & (\omega_n^{1})^{n-1} \\ \vdots & \vdots & \ddots & \vdots \\ (\omega_n^{(n-1)})^0 &(\omega_n^{(n-1)})^1 & \cdots & (\omega_n^{(n-1)})^{n-1} \\\end{matrix}\right] \begin{bmatrix} a(\omega_n^0) \\ a(\omega_n^1) \\ \vdots \\ a(\omega_n^{n-1}) \end{bmatrix}$

那这个时候我们只需要把$A(\omega_n^0) ,A(\omega_n^1) ,\dots,A(\omega_n^{n-1})$当作点值，并且把DFT过程中的$\omega_n^{k}$替换成$\omega_n^{-k}$就可以了

6.FFT的递归实现

dd只要理解了最初的迭代过程应该就问题不大了

就是简单的模拟出分治过程

omiga数组最好是可以预处理出来，但是这样的实现方式依旧有很大的常数

void fft(int n, Complex *p, int pos, int step, Complex *omg) {
  if(n == 1) return;
  int m = n >> 1;
  fft(m, p, pos, step << 1, omg);
  fft(m, p, pos + step, step << 1, omg);
  for(int k = 0; k < m; k++) {
    int cur = 2 * step * k;
    tmp[k] = p[cur + pos] + omg[k * step] * p[cur + pos + step];
    tmp[k + m] = p[cur + pos] - omg[k * step] * p[cur + pos + step];
  }
  for(int i = 0; i < n; i++) p[i * step + pos] = tmp[i];
}

7.FFT的迭代实现

我们考虑每一次的分组递归

第一次显然是按照最后一个二进制位的奇偶性来分组的

进入下一层迭代后就发现变成了一个$\frac{n}{2}$次多项式，可以看做所有的指数都除以了2，参考$(14)$

所以最后一位就没有意义了，下一次排序就是按照倒数第二位的奇偶性来进行分组的

发现本质就是把二进制反转进行交换，很奇妙的

可以这样预处理：

1
2
3

for (int i = 0; i < n; i++) {
  rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << (lim - 1));
}

所以就可以用迭代来进行运算啦

void transform(Complex f[N], Complex w[N]) {
  for (int i = 0; i < p; i++) if (i < rev[i]) swap(f[i], f[rev[i]]);
  for (int len = 1; len < p; len <<= 1) {
    int step = (len << 1);
    for (Complex *cur = f; cur != f + p; cur += step) {
      for (int i = 0; i < len; i++) {
        Complex t = w[p / step * i] * cur[i + len];
        cur[i + len] = cur[i] - t;
        cur[i] += t; 
      }
    }
  }
}

8.板子

总的板子

#include<bits/stdc++.h>

using namespace std;

const double PI = acos(-1.0);
const int N = 262144;

struct Complex {
	double x, y;
	
  Complex() {}
	
  Complex(double x, double y): x(x), y(y) {}
	
  Complex operator + (const Complex & a) const { 
    return Complex(x + a.x, y + a.y);
  }
	
  void operator += (const Complex & a) {
    *this = *this + a;
  }
	
  Complex operator - (const Complex & a) const {
    return Complex(x - a.x, y - a.y);
  }
  
  void operator -= (const Complex & a) {
    *this = *this - a;
  }
  
  Complex operator * (const Complex & a) const {
    return Complex(x * a.x - y * a.y, x * a.y + y * a.x);
  }
  
  void operator *= (const Complex & a) {
    *this = *this * a;
  }
  
  Complex operator / (const Complex & b) const {
    Complex c = b.conj();
    return (*this) * c / ((b * c).x);
  }
  
  void operator /= (const Complex & a) {
    *this = *this / a;
  }
  
	Complex operator * (const double & a) const { 
    return Complex(x * a, y * a);
  }
  
  void operator *= (const double & a) {
    *this = *this * a;
  }
  
	Complex operator / (const double & a) const {
    return Complex(x / a, y / a);
  }
  
  void operator /= (const double & a) {
    *this = *this / a;
  }
  
	Complex conj() const {
    return Complex(x, -y);
  }
} ;

struct fft {
  Complex a[N], b[N], c[N], omg[N], inv[N];
  int n, m, p, lim, rev[N];
  
  void input() {
   scanf("%d %d", &n, &m);
    ++n, ++m;
    for (int i = 0; i < n; i++) {
      int v; scanf("%d", &v);
      a[i] = Complex(v, 0);
    }
    for (int i = 0; i < m; i++) {
      int v; scanf("%d", &v);
      b[i] = Complex(v, 0);
    }
  }
  
  void output() {
    for (int i = 0; i < n + m - 1; i++) {
      printf("%d ", (int)(c[i].x + 0.5));
    }
  }
  
  void init() {
    for (p = 1; p < n + m - 1; p <<= 1);
    for (; (1 << lim) < p; ++lim);
    for (int i = 0; i < p; i++) {
      omg[i] = Complex(cos(2.0 * PI * i / p), sin(2.0 * PI * i / p));
      inv[i] = omg[i].conj();
      rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << (lim - 1));
    }
  }
  
  void transform(Complex f[N], Complex w[N]) {
    for (int i = 0; i < p; i++) if (i < rev[i]) swap(f[i], f[rev[i]]);
    for (int len = 1; len < p; len <<= 1) {
      int step = (len << 1);
      for (Complex *cur = f; cur != f + p; cur += step) {
        for (int i = 0; i < len; i++) {
          Complex t = w[p / step * i] * cur[i + len];
          cur[i + len] = cur[i] - t;
          cur[i] += t; 
        }
      }
    }
  }
  
  void solve() {
    input();
    init();
    transform(a, omg);
    transform(b, omg);
    for (int i = 0; i < p; i++) c[i] = a[i] * b[i];
    transform(c, inv);
    for (int i = 0; i < p; i++) c[i] = Complex(c[i].x / p, 0.0);
    output();
  }
} fft;

int main() {
  fft.solve();
  return 0;
}

DP优化

Posted on 2018-12-09 | In 知识点整理

DP优化

1.矩阵快速幂优化DP

当DP的转移可以用转移矩阵表示出来的时候，这个DP一般都是可以用矩阵快速幂来进行优化的

而且矩阵快速幂优化DP的特征非常的明显，一般是有一维状态数特别大，一维状态数特别小

然后建立转移矩阵的小技巧就是$trans_{i,j}$表示从状态i转移到状态j的贡献

然后矩阵快速幂还可以把乘法变成加法，加法变成取min/max，可以证明这样还是满足结合律的，实际的dp含义也不会被改变

是一种优化转移的很好的方式

当然，矩阵维护DP也可以扩展到动态DP，在这里跟题目无关就不讲了

2.数据结构优化DP

数据结构优化DP

一般都是直接在数据结构里面维护每个DP值（和那个位置上对应的贡献），这个时候需要把移动指针产生的贡献全部拆分开来，然后如果贡献的叠加范围是存在某个特殊的性质（比如区间，或者某个数的倍数）就可以选择相应的数据结构进行维护

数据结构的使用非常灵活，需要多加练习才可以熟练掌握

3.决策单调性优化

3.1 单调队列/单调栈优化

一种比较简单的实现形式，通常是有比较显然的决策单调性

通常有两种方式：

3.1.1 维护点值

数据结构中只需要存点，然后可以直接每次取维护的队首/栈顶来进行更新，维护简单

3.1.2 维护区间

我们发现每个决策点的最优贡献是一个区间

那么我们就维护一个很多个区间组成的队列

这个队列每次加入的时候就可以进行比较并维护

具体实现是这样的：

如果当前决策点在最后一个位置都不会比最后一个最优区间优秀，说明他没有贡献
如果比当前最后一个区间全部的位置都要更优就可以直接删除最后的区间
如果只比当前最后的区间的一部分更优就二分出当前结点比上一个节点优的最早的节点，并把从二分出的节点到末尾区间的最优贡献点变成当前结点

3.1.2的单调队列还可以用来维护四边形不等式优化的DP

3.2 斜率优化

斜率优化的一个典型形式就是$dp_{i}=dp_{j}+a_i*b_j+c_j$

这时候因为出现了$a_i*b_j$，所以如果可以优化一般都是斜率优化（大概是因为其他的优化方式都不涉及乘除）

然后就可以非常无脑的把这个式子用一次函数式表示出来

比如上面的这个式子经过移项变成$-a_i*b_j+dp_{i}=dp_j+c_j$

观察一下这个式子发现如果令

$y = dp_j +c_j$
$x=b_j$
$k=-a_i$
$b=dp_i$

那么原来的式子实际上就变成了$y=kx+b$

我们显然要求的就是截距b的某个极值

这样我们就可以把一个决策点j转化成二维平面上的一个点$(b_j,dp_j+c_j)$

我们每次要用斜率$-a_i$去截出一个最大的$dp_i$

很显然这个最优决策点一定存在于凸壳上面，所以直接用单调队列/单调栈维护出凸壳就可以了

然后根据题目看需不需要在凸壳上二分出最优的决策点就可以了

至于是上凸壳还是下凸壳，就可以根据k的单调性确定了

但是在x坐标$b_j$不单调的时候就只有使用3.2.2的方法了

3.3 分治优化

3.3.1 普通分治

有的时候我们不方便找到决策点但是可以知道，如果$i$的决策点是$p_i$，那么对于$j<i<k$有$p_j\le p_i\le p_k$

那我们直接对于mid包里找到$p_{min}$然后递归成区间求解就可以了

3.3.2 CDQ分治

这里对应斜率优化的时候$x$坐标不单调的情况

因为x不单调所以我们没有办法~~（其实也有办法）~~动态维护凸壳所以我们再用分治解决这个问题

首先选择一个mid，然后递归求解左边区间的问题，这个时候我们就已经知道了左边区间的所有的DP值

然后于是就可以把左边的所有点按照x归并排序之后建成凸壳并用右边的点进行询问，询问完了就可以继续递归右子区间进行解题了

分治复杂度是$nlogn$的

3.4 四边形不等式优化

看起来是最简单的结构，但是用到了最复杂的思想

一般是需要证明一个这样的式子：

$w_{i,j+1}+w_{i+1,j}\le w_{i, j}+ w_{i+1,j+1}$

所以就可以得到

$w_{i+1,j}-w_{i+1,j+1}\le w_{i,j}-w_{i,j+1}$

$w_{i,j+1}-w_{i+1,j+1}\le w_{i,j}-w_{i+1,j}$

推导出的通式就是：$对于i<i’\le j<j’,有w_{i,j}+w_{i’,j’}≤w_{i’,j}+w_{i,j’} $

然后对于一个常见的转移方程$dp_i=dp_j+w_{i,j}$

设i的决策点是$p_i$，那么i-1的决策点$p_{i-1}$一定满足：

任意的$k<p_{i-1}$

有$dp_{p_{i-1}}+w_{p_{i-1},i-1}\le dp_{k}+w_{k,i-1}$

即$w_{p_{i-1},i-1}-w_{k,i-1}\le dp_{k}-dp_{p_{i-1}}$

如果w满足平行四边形不等式，那么也一定有：

$w_{p_{i-1},i}-w_{k,i}\le dp_{k}-dp_{p_{i-1}}$

所以有$dp_{p_{i-1}}+w_{p_{i-1},i} \le dp_{k}+w_{k,i}$

就证明了单调性，因为这个东西也是区间覆盖

所以还是可以用单调队列进行维护的

完结撒花