Polished the content.

This commit is contained in:
Yudong Jin 2022-12-06 02:19:26 +08:00
parent 6c0eccd7b3
commit c0fd51c312

View File

@ -1,18 +1,17 @@
# AVL 树
## AVL 树起源
## AVL 树起源
在「二叉搜索树」章节中提到,进行多次插入与删除操作后,二叉搜索树可能会退化为链表。此时所有操作的时间复杂度都会由 $O(\log n)$ 劣化至 $O(n)$ 。如,删除结点 4 后,该二叉搜索树就会退化为链表。
在「二叉搜索树」章节中提到,进行多次插入与删除操作后,二叉搜索树可能会退化为链表。此时所有操作的时间复杂度都会由 $O(\log n)$ 劣化至 $O(n)$ 。如下图所示执行两步删除结点后,该二叉搜索树就会退化为链表。
=== "删除前"
![binary search tree1](avl_tree.assets/binary_search_tree1.png)
=== "删除后"
![binary search tree2](avl_tree.assets/binary_search_tree2.png)
为了解决这一问题G. M. Adelson-Velsky 和 E. M. Landis 在其 1962 年发表的论文 "An algorithm for the organization of info
rmation" 中提出了「平衡二叉搜索树」也以两位作者命名常被称为「AVL 树」。
为了解决这一问题G. M. Adelson-Velsky 和 E. M. Landis 在其 1962 年发表的论文 "An algorithm for the organization of information" 中提出了「平衡二叉搜索树」并以两位作者命名常被称为「AVL 树」。
## AVL 树性质
## AVL 树性质
「AVL 树」既是「二叉搜索树」又是「平衡二叉树」,同时满足这两种二叉树的所有性质。「平衡二叉树」规定树中任意结点左右子树的高度差的绝对值不能超过 1 。本文定义:
@ -23,11 +22,11 @@ rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,
设「平衡因子」为 $f$ ,则一棵 AVL 树的任意结点的平衡因子满足 $-1 \le f \le 1$
## AVL 树优势
## AVL 树优势
提出 AVL 树的两位大佬的厉害之处在于,他们设计了一系列操作,使得 AVL 树在不断添加与删除结点后,仍然不会发生退化,进而使得各种操作的时间复杂度均能保持在 $O(\log n)$ 级别。
提出 AVL 树的两位大佬的厉害之处在于,**他们设计了一系列操作,使得 AVL 树在不断添加与删除结点后,仍然不会发生退化**,进而使得各种操作的时间复杂度均能保持在 $O(\log n)$ 级别。
## AVL 树操作
## AVL 树操作
### 查找结点
@ -35,17 +34,17 @@ rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,
### 插入结点
由于平衡二叉树需要保证其任意结点的平衡因子满足限制,所以在插入结点后可能会造成 AVL 树的失衡。例如,平衡二叉树在插入结点 0 前 / 后如下图所示(括号内表示当前结点的平衡因子):
**插入结点可能会造成平衡二叉树失衡。** 例如下图(括号内数值为结点的平衡因子),插入后结点 2 和 结点 3 已经不满足平衡二叉树的性质,我们将这一现象称为「失衡」。
=== "插入前"
![avl tree 1](avl_tree.assets/avl_tree1.png)
=== "插入后"
![avl tree 2](avl_tree.assets/avl_tree2.png)
观察发现,插入后结点 2 和 结点 3 已经不满足平衡二叉树的性质,我们将这一现象称为 **失衡** 。为了解决该问题,首先需要分析哪些结点会出现失衡,经过观察可得两条规律:
为了解决失衡问题,首先需要 **分析哪些结点会出现失衡**,经过观察可得两条规律:
- 出现失衡的结点都必然出现在新插入结点与根结点的路径上;
- 在这条路径上,该插入结点的父结点一定不会失衡,即首先失衡的结点必然是父节点之上的结点;
- 在此路径上,出现失衡的结点必然是新插入结点的父结点之上的结点;
!!! tip "证明"
@ -56,19 +55,22 @@ rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,
因此父结点一定不会失衡,证毕。
现在考虑如何将一个失衡点恢复为平衡点。
**接下来考虑如何将一个失衡点恢复为平衡点。** 我们知道二叉搜索树的中序遍历序列一定是严格升序的,而在论文中,作者定义了一种「旋转 Rotation」的操作其可 **在不影响二叉树中序遍历序列的情况下,降低失衡点左右子树的高度差**
我们知道对于二叉搜索树的中序遍历序列一定是严格升序的。在论文中,作者定义了一种被称为「旋转 Rotation」的操作其可 **在不影响二叉树中序遍历序列的情况下,降低失衡点左右子树的高度差**
!!! note
换言之,「旋转」操作可以保持树为「二叉搜索树」,并且可让树逐渐变为平衡二叉树。
#### 右旋
以上文中提到的发生失衡的 AVL 树为例,「右旋」的具体操作为:
以上文中提到的发生失衡的 AVL 树为例,首个失衡点是 **结点 2** 。将该结点记为 `node` ,其左子节点记为 `node.left` ,「右旋」就好像将这两个结点进行 “顺时针旋转” ,操作流程为:
1. 首先可以找到第一个发生失衡的点是结点 2 。
2. 以该点为轴顺时针旋转,使该点左孩子的右子树指向该点,该点的左子树指向其左孩子的右子树。
3. 将原本的左孩子连接至该点的父结点
1. `node.left` 的右指针指向 `node`
2. `node` 的左指针指向 `node.left` 的右子树。
3. `node` 的父结点指向 `node.left` ,替代原来 `node` 的位置
观察得知,经过右旋后,整棵二叉树已经恢复平衡,并且中序遍历序列也保持不变。
以上流程比较晦涩难记,实际上,右旋就像是把 `node.left` “拎起来” 顺时针旋转了一下,可以使用这个动画辅助理解。
观察得知,经过右旋后,整棵二叉树已经恢复平衡,并且仍然为二叉搜索树。
=== "Step 1"
![avl tree3](avl_tree.assets/avl_tree2.png)
@ -79,13 +81,13 @@ rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,
#### 左旋
下面来看与之对应的「左旋」,需要使用左旋的情况与右旋相似,下面以例子来说明左旋的过程
类似地,下图中首个失衡点是 **结点 3** ,将失衡结点记为 `node` ,其右子节点记为 `node.right` ,「左旋」就好像将这两个结点进行 “逆时针旋转” ,操作流程为
1. 首先可以找到第一个发生失衡的点是结点 3 。
2. 以该点为轴逆时针旋转,使该点右孩子的左子树指向该点,该点的右子树指向其右孩子的左子树。
3. 将原本的右孩子连接至该点的父结点
1. `node.right` 的左指针指向 `node`
2. `node` 的右指针指向 `node.right` 的左子树。
3. `node` 的父结点指向 `node.right` ,替代原来 `node` 的位置
与右旋相同,左旋也可以让失衡的结点恢复平衡,同时不会改变中序遍历序列
观察发现,**「左旋」和「右旋」操作是镜像对称的**,因此我们只需记住一个操作即可,另一个可以直接推导出来
=== "Step 1"
![rotate left1](avl_tree.assets/rotate_left1.png)
@ -96,20 +98,12 @@ rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,
#### 双旋
「双旋」分为两种,一种是「先左旋后右旋」,另一种是「先右旋后左旋」。
「双旋」是左旋和右旋的组合,一种是「先左旋后右旋」,另一种是「先右旋后左旋」。
以先左后右为例,如果直接对下图二叉树的失衡点执行右旋,会发现并不能使失衡点恢复平衡。
比如对于下图的失衡结点 3 ,单一使用左旋或右旋无法使该结点恢复平衡,需要「先左旋后右旋」。设结点 3 为 `node` ,其左子结点为 `node.left` ,则分为两步:
=== "Step 1"
![rotate left right1](avl_tree.assets/rotate_left_right1.png)
=== "Step 2"
![rotate left right2](avl_tree.assets/rotate_left_right2.png)
为了解决该问题,需要「先左旋后右旋」,即分为两步:
1. 将失衡点的左孩子执行左旋。
2. 对失衡点执行右旋。
1. 对 `node.left` 执行「左旋」。
2. 对 `node` 执行「右旋」。
=== "Step 1"
![rotate left right3](avl_tree.assets/rotate_left_right1.png)
@ -118,7 +112,9 @@ rmation" 中提出了「平衡二叉搜索树」,也以两位作者命名,
=== "Step 3"
![rotate left right5](avl_tree.assets/rotate_left_right4.png)
同理,「先左旋后右旋」是先将失衡点的左孩子执行右旋,然后对失衡点执行左旋。
同理,「先右旋后左旋」是先对 `node.right` 执行右旋,然后对 `node` 执行左旋。
(图)
#### 旋转选择