Splay 树
本页面将简要介绍如何用 Splay 维护二叉查找树。
定义
Splay 树, 或 伸展树,是一种平衡二叉查找树,它通过 Splay/伸展操作 不断将某个节点旋转到根节点,使得整棵树仍然满足二叉查找树的性质,能够在均摊
Splay 树由 Daniel Sleator 和 Robert Tarjan 于 1985 年发明。
结构
二叉查找树的性质
Splay 树是一棵二叉搜索树,查找某个值时满足性质:左子树任意节点的值
节点维护信息
rt | tot | fa[i] | ch[i][0/1] | val[i] | cnt[i] | sz[i] |
---|---|---|---|---|---|---|
根节点编号 | 节点个数 | 父亲 | 左右儿子编号 | 节点权值 | 权值出现次数 | 子树大小 |
操作
基本操作
maintain(x)
:在改变节点位置后,将节点的 更新。 get(x)
:判断节点是父亲节点的左儿子还是右儿子。 clear(x)
:销毁节点。
实现
旋转操作
为了使 Splay 保持平衡而进行旋转操作,旋转的本质是将某个节点上移一个位置。
旋转需要保证:
- 整棵 Splay 的中序遍历不变(不能破坏二叉查找树的性质)。
- 受影响的节点维护的信息依然正确有效。
root
必须指向旋转后的根节点。
在 Splay 中旋转分为两种:左旋和右旋。
过程
具体分析旋转步骤(假设需要旋转的节点为
- 将
的左儿子指向 的右儿子,且 的右儿子(如果 有右儿子的话)的父亲指向 ; ch[y][0]=ch[x][1]; fa[ch[x][1]]=y;
- 将
的右儿子指向 ,且 的父亲指向 ; ch[x][chk^1]=y; fa[y]=x;
- 如果原来的
还有父亲 ,那么把 的某个儿子(原来 所在的儿子位置)指向 ,且 的父亲指向 。 fa[x]=z; if(z) ch[z][y==ch[z][1]]=x;
实现
void rotate(int x) {
int y = fa[x], z = fa[y], chk = get(x);
ch[y][chk] = ch[x][chk ^ 1];
if (ch[x][chk ^ 1]) fa[ch[x][chk ^ 1]] = y;
ch[x][chk ^ 1] = y;
fa[y] = x;
fa[x] = z;
if (z) ch[z][y == ch[z][1]] = x;
maintain(y);
maintain(x);
}
Splay 操作
Splay 操作规定:每访问一个节点
Splay 操作即对
-
zig: 在
是根节点时操作。Splay 树会根据 和 间的边旋转。 存在是用于处理奇偶校验问题,仅当 在 splay 操作开始时具有奇数深度时作为 splay 操作的最后一步执行。 即直接将
左旋或右旋(图 1, 2) -
zig-zig: 在
不是根节点且 和 都是右侧子节点或都是左侧子节点时操作。下方例图显示了 和 都是左侧子节点时的情况。Splay 树首先按照连接 与其父节点 边旋转,然后按照连接 和 的边旋转。 即首先将
左旋或右旋,然后将 右旋或左旋(图 3, 4)。 -
zig-zag: 在
不是根节点且 和 一个是右侧子节点一个是左侧子节点时操作。Splay 树首先按 和 之间的边旋转,然后按 和 新生成的结果边旋转。 即将
先左旋再右旋、或先右旋再左旋(图 5, 6)。 Tip
请读者尝试自行模拟
种旋转情况,以理解 Splay 的基本思想。
实现
void splay(int x) {
for (int f = fa[x]; f = fa[x], f; rotate(x))
if (fa[f]) rotate(get(x) == get(f) ? f : x);
rt = x;
}
插入操作
过程
插入操作是一个比较复杂的过程,具体步骤如下(假设插入的值为
- 如果树空了,则直接插入根并退出。
- 如果当前节点的权值等于
则增加当前节点的大小并更新节点和父亲的信息,将当前节点进行 Splay 操作。 - 否则按照二叉查找树的性质向下找,找到空节点就插入即可(请不要忘记 Splay 操作)。
实现
void ins(int k) {
if (!rt) {
val[++tot] = k;
cnt[tot]++;
rt = tot;
maintain(rt);
return;
}
int cur = rt, f = 0;
while (1) {
if (val[cur] == k) {
cnt[cur]++;
maintain(cur);
maintain(f);
splay(cur);
break;
}
f = cur;
cur = ch[cur][val[cur] < k];
if (!cur) {
val[++tot] = k;
cnt[tot]++;
fa[tot] = f;
ch[f][val[f] < k] = tot;
maintain(tot);
maintain(f);
splay(tot);
break;
}
}
}
查询 x 的排名
过程
根据二叉查找树的定义和性质,显然可以按照以下步骤查询
- 如果
比当前节点的权值小,向其左子树查找。 - 如果
比当前节点的权值大,将答案加上左子树( )和当前节点( )的大小,向其右子树查找。 - 如果
与当前节点的权值相同,将答案加 并返回。
注意最后需要进行 Splay 操作。
实现
int rk(int k) {
int res = 0, cur = rt;
while (1) {
if (k < val[cur]) {
cur = ch[cur][0];
} else {
res += sz[ch[cur][0]];
if (!cur) return res + 1;
if (k == val[cur]) {
splay(cur);
return res + 1;
}
res += cnt[cur];
cur = ch[cur][1];
}
}
}
查询排名 x 的数
过程
设
- 如果左子树非空且剩余排名
不大于左子树的大小 ,那么向左子树查找。 - 否则将
减去左子树的和根的大小。如果此时 的值小于等于 ,则返回根节点的权值,否则继续向右子树查找。
实现
int kth(int k) {
int cur = rt;
while (1) {
if (ch[cur][0] && k <= sz[ch[cur][0]]) {
cur = ch[cur][0];
} else {
k -= cnt[cur] + sz[ch[cur][0]];
if (k <= 0) {
splay(cur);
return val[cur];
}
cur = ch[cur][1];
}
}
}
查询前驱
过程
前驱定义为小于
实现
int pre() {
int cur = ch[rt][0];
if (!cur) return cur;
while (ch[cur][1]) cur = ch[cur][1];
splay(cur);
return cur;
}
查询后继
过程
后继定义为大于
实现
int nxt() {
int cur = ch[rt][1];
if (!cur) return cur;
while (ch[cur][0]) cur = ch[cur][0];
splay(cur);
return cur;
}
合并两棵树
过程
合并两棵 Splay 树,设两棵树的根节点分别为
- 如果
和 其中之一或两者都为空树,直接返回不为空的那一棵树的根节点或空树。 - 否则将
树中的最大值 到根,然后把它的右子树设置为 并更新节点的信息,然后返回这个节点。
删除操作
过程
删除操作也是一个比较复杂的操作,具体步骤如下:
首先将
- 如果
(有不止一个 ),那么将 减 并退出。 - 否则,合并它的左右两棵子树即可。
实现
void del(int k) {
rk(k);
if (cnt[rt] > 1) {
cnt[rt]--;
maintain(rt);
return;
}
if (!ch[rt][0] && !ch[rt][1]) {
clear(rt);
rt = 0;
return;
}
if (!ch[rt][0]) {
int cur = rt;
rt = ch[rt][1];
fa[rt] = 0;
clear(cur);
return;
}
if (!ch[rt][1]) {
int cur = rt;
rt = ch[rt][0];
fa[rt] = 0;
clear(cur);
return;
}
int cur = rt, x = pre();
fa[ch[cur][1]] = x;
ch[x][1] = ch[cur][1];
clear(cur);
maintain(rt);
}
时间复杂度
在 Splay 树中,由于 zig 和 zag 操作是对称的,因此我们只需分析 zig、zig-zig 和 zig-zag 三种操作的复杂度。为此,我们采用 势能分析法,通过研究势能的变化来推导操作的均摊复杂度。假设对一棵包含
定义:
-
单个节点的势能:
,其中 表示以节点 为根的子树大小。 -
整棵树的势能:
,即树中所有节点势能的总和,初始势能满足 。 -
第
次操作的均摊成本: ,其中 为实际操作代价, 和 分别为操作后和操作前的势能。
性质:
- 如果
是 的父节点,则有 ,即父节点的势能不小于子节点的势能。 - 由于根节点的子树大小在操作前后保持不变,因此根节点的势能在操作过程中不变。
- 如果
的两个子节点分别是 和 ,那么有
性质 3 的证明
- 设
, , ,则有 。 - 因此,
。 - 带入
,可以推导出: 。
接下来,分别对 zig、zig-zig 和 zig-zag 操作进行势能分析。
Zig:根据性质 1 和 2,有
Zig-Zig:根据性质 1 和 2,有
由此,均摊成本为:
简化后:
Zig-Zag:根据性质 1 和 2,有
由此,均摊成本为:
简化后:
总结:
由此可见,三种 splay 步骤的均摊成本全部可以缩放为
继而可得:
因此,对于
实现
#include <cstdio>
constexpr int N = 100005;
int rt, tot, fa[N], ch[N][2], val[N], cnt[N], sz[N];
struct Splay {
void maintain(int x) { sz[x] = sz[ch[x][0]] + sz[ch[x][1]] + cnt[x]; }
bool get(int x) { return x == ch[fa[x]][1]; }
void clear(int x) {
ch[x][0] = ch[x][1] = fa[x] = val[x] = sz[x] = cnt[x] = 0;
}
void rotate(int x) {
int y = fa[x], z = fa[y], chk = get(x);
ch[y][chk] = ch[x][chk ^ 1];
if (ch[x][chk ^ 1]) fa[ch[x][chk ^ 1]] = y;
ch[x][chk ^ 1] = y;
fa[y] = x;
fa[x] = z;
if (z) ch[z][y == ch[z][1]] = x;
maintain(y);
maintain(x);
}
void splay(int x) {
for (int f = fa[x]; f = fa[x], f; rotate(x))
if (fa[f]) rotate(get(x) == get(f) ? f : x);
rt = x;
}
void ins(int k) {
if (!rt) {
val[++tot] = k;
cnt[tot]++;
rt = tot;
maintain(rt);
return;
}
int cur = rt, f = 0;
while (1) {
if (val[cur] == k) {
cnt[cur]++;
maintain(cur);
maintain(f);
splay(cur);
break;
}
f = cur;
cur = ch[cur][val[cur] < k];
if (!cur) {
val[++tot] = k;
cnt[tot]++;
fa[tot] = f;
ch[f][val[f] < k] = tot;
maintain(tot);
maintain(f);
splay(tot);
break;
}
}
}
int rk(int k) {
int res = 0, cur = rt;
while (1) {
if (k < val[cur]) {
cur = ch[cur][0];
} else {
res += sz[ch[cur][0]];
if (!cur) return res + 1;
if (k == val[cur]) {
splay(cur);
return res + 1;
}
res += cnt[cur];
cur = ch[cur][1];
}
}
}
int kth(int k) {
int cur = rt;
while (1) {
if (ch[cur][0] && k <= sz[ch[cur][0]]) {
cur = ch[cur][0];
} else {
k -= cnt[cur] + sz[ch[cur][0]];
if (k <= 0) {
splay(cur);
return val[cur];
}
cur = ch[cur][1];
}
}
}
int pre() {
int cur = ch[rt][0];
if (!cur) return cur;
while (ch[cur][1]) cur = ch[cur][1];
splay(cur);
return cur;
}
int nxt() {
int cur = ch[rt][1];
if (!cur) return cur;
while (ch[cur][0]) cur = ch[cur][0];
splay(cur);
return cur;
}
void del(int k) {
rk(k);
if (cnt[rt] > 1) {
cnt[rt]--;
maintain(rt);
return;
}
if (!ch[rt][0] && !ch[rt][1]) {
clear(rt);
rt = 0;
return;
}
if (!ch[rt][0]) {
int cur = rt;
rt = ch[rt][1];
fa[rt] = 0;
clear(cur);
return;
}
if (!ch[rt][1]) {
int cur = rt;
rt = ch[rt][0];
fa[rt] = 0;
clear(cur);
return;
}
int cur = rt;
int x = pre();
fa[ch[cur][1]] = x;
ch[x][1] = ch[cur][1];
clear(cur);
maintain(rt);
}
} tree;
int main() {
int n, opt, x;
for (scanf("%d", &n); n; --n) {
scanf("%d%d", &opt, &x);
if (opt == 1)
tree.ins(x);
else if (opt == 2)
tree.del(x);
else if (opt == 3)
printf("%d\n", tree.rk(x));
else if (opt == 4)
printf("%d\n", tree.kth(x));
else if (opt == 5)
tree.ins(x), printf("%d\n", val[tree.pre()]), tree.del(x);
else
tree.ins(x), printf("%d\n", val[tree.nxt()]), tree.del(x);
}
return 0;
}
序列操作
Splay 也可以运用在序列上,用于维护区间信息。与线段树对比,Splay 常数较大,但是支持更复杂的序列操作,如区间翻转等。
将序列建成的 Splay 有如下性质:
-
Splay 的中序遍历相当于原序列从左到右的遍历。
-
Splay 上的一个节点代表原序列的一个元素;Splay 上的一颗子树,代表原序列的一段区间。
因为有 splay 操作,可以快速提取出代表某个区间的 Splay 子树。
在操作之前,你需要先把这颗 Splay 建出来。根据 Splay 的特性,直接建出一颗只有右儿子的链即可,时间复杂度仍然是正确的。
一些进阶操作
Splay 的一颗子树代表原序列的一段区间。现在想找到序列区间
一般会建立左右两个哨兵节点
所以要将 splay 函数进行一些修改,能够实现将节点旋转到目标点的儿子。如果目标点 goal
为
实现
void splay(int x, int goal = 0) {
if (goal == 0) rt = x;
while (fa[x] != goal) {
int f = fa[x], g = fa[fa[x]];
if (g != goal) {
if (get(f) == get(x))
rotate(f);
else
rotate(x);
}
rotate(x);
}
}
区间翻转
Splay 常见的应用之一,模板题目是 文艺平衡树。
过程
先将询问区间的子树提取出来。因为是区间翻转,我们需要将这颗子树的中序遍历顺序翻转。
一个暴力做法是每次将根节点的左右儿子交换,然后递归左右子树做同样的操作,这样复杂度为
实现
void tagrev(int x) {
swap(ch[x][0], ch[x][1]);
lazy[x] ^= 1;
}
void pushdown(int x) {
if (lazy[x]) {
tagrev(ch[x][0]);
tagrev(ch[x][1]);
lazy[x] = 0;
}
}
void reverse(int l, int r) {
int L = kth(l - 1), R = kth(r + 1);
splay(L), splay(R, L);
int tmp = ch[ch[L][1]][0];
tagrev(tmp);
}
实现
注意
#include <algorithm>
#include <cstdio>
constexpr int N = 100005;
int n, m, l, r, a[N];
int rt, tot, fa[N], ch[N][2], val[N], sz[N], lazy[N];
struct Splay {
void maintain(int x) { sz[x] = sz[ch[x][0]] + sz[ch[x][1]] + 1; }
bool get(int x) { return x == ch[fa[x]][1]; }
void clear(int x) {
ch[x][0] = ch[x][1] = fa[x] = val[x] = sz[x] = lazy[x] = 0;
}
void rotate(int x) {
int y = fa[x], z = fa[y], chk = get(x);
ch[y][chk] = ch[x][chk ^ 1];
if (ch[x][chk ^ 1]) fa[ch[x][chk ^ 1]] = y;
ch[x][chk ^ 1] = y;
fa[y] = x;
fa[x] = z;
if (z) ch[z][y == ch[z][1]] = x;
maintain(y);
maintain(x);
}
void splay(int x, int goal = 0) {
if (goal == 0) rt = x;
while (fa[x] != goal) {
int f = fa[x], g = fa[fa[x]];
if (g != goal) {
if (get(f) == get(x))
rotate(f);
else
rotate(x);
}
rotate(x);
}
}
void tagrev(int x) {
std::swap(ch[x][0], ch[x][1]);
lazy[x] ^= 1;
}
void pushdown(int x) {
if (lazy[x]) {
tagrev(ch[x][0]);
tagrev(ch[x][1]);
lazy[x] = 0;
}
}
int build(int l, int r, int f) {
if (l > r) return 0;
int mid = (l + r) / 2, cur = ++tot;
val[cur] = a[mid], fa[cur] = f;
ch[cur][0] = build(l, mid - 1, cur);
ch[cur][1] = build(mid + 1, r, cur);
maintain(cur);
return cur;
}
int kth(int k) {
int cur = rt;
while (1) {
pushdown(cur);
if (ch[cur][0] && k <= sz[ch[cur][0]]) {
cur = ch[cur][0];
} else {
k -= 1 + sz[ch[cur][0]];
if (k <= 0) {
splay(cur);
return cur;
}
cur = ch[cur][1];
}
}
}
void reverse(int l, int r) {
int L = kth(l), R = kth(r + 2);
splay(L), splay(R, L);
int tmp = ch[ch[L][1]][0];
tagrev(tmp);
}
void print(int x) {
pushdown(x);
if (ch[x][0]) print(ch[x][0]);
if (val[x] >= 1 && val[x] <= n) printf("%d ", val[x]);
if (ch[x][1]) print(ch[x][1]);
}
} tree;
int main() {
scanf("%d%d", &n, &m);
for (int i = 0; i <= n + 1; i++) a[i] = i;
rt = tree.build(0, n + 1, 0);
while (m--) {
scanf("%d%d", &l, &r);
tree.reverse(l, r);
}
tree.print(rt);
return 0;
}
例题
以下题目都是裸的 Splay 维护二叉查找树。
习题
参考资料与注释
本文部分内容引用于 algocode 算法博客,特别鸣谢!
创建日期: 2018年7月11日