查找类算法之二分搜索树 | 算法必看系列十

动画 | 什么是二分搜索树(二叉查找树)?

二分搜索树属性
查找类算法之二分搜索树 | 算法必看系列十
二分搜索树的又名比较多,有的叫二叉排序树,也有的叫二叉查找树,或者有序二叉查找树。是指一棵空树或者具有下列性质的二叉树:

1.若任意节点的左子树不空,则左子树所有节点的值均小于它根节点的值;

2.若任意节点的右子树不空,则右子树所有节点的值均大于它根节点的值;

3.任意节点的左、右子树也分别为二叉查找树;

4.没有键值相等的节点。

它的查找、插入和删除的时间复杂度都等于树高,期望值是O(logn),最坏时间复杂度是O(n),比如树退化成线性表。
查找类算法之二分搜索树 | 算法必看系列十
查找元素
二分搜索树是为了实现快速查找而生的,也支持快速添加和删除一个数据。如何查找某个元素首先跟根节点去做比较,如果相等的话就返回;如果待查元素要比根节点小,就进行左子树递归查找;如果待查元素要比根节点大,就进行右子树的递归查找;如果查找到最后还没有一个符合的元素,就返回null。
递归查找
递归查找的方式有很多,有层序遍历、前序遍历、中序遍历和后序遍历。我这里就举后面三个遍历方式。
Code
如果代码是下面这样写的,那它遍历过程是怎么样的?看下面动画。
查找类算法之二分搜索树 | 算法必看系列十
动画:前序遍历
(响应读者的建议,动画不放BGM了二分搜索树(二叉查找树)?
二分搜索树属性
查找类算法之二分搜索树 | 算法必看系列十
二分搜索树的又名比较多,有的叫二叉排序树,也有的叫二叉查找树,或者有序二叉查找树。是指一棵空树或者具有下列性质的二叉树:

1.若任意节点的左子树不空,则左子树所有节点的值均小于它根节点的值;

2.若任意节点的右子树不空,则右子树所有节点的值均大于它根节点的值;

3.任意节点的左、右子树也分别为二叉查找树;

4.没有键值相等的节点。

它的查找、插入和删除的时间复杂度都等于树高,期望值是O(logn),最坏时间复杂度是O(n),比如树退化成线性表。
查找类算法之二分搜索树 | 算法必看系列十
查找元素
二分搜索树是为了实现快速查找而生的,也支持快速添加和删除一个数据。如何查找某个元素首先跟根节点去做比较,如果相等的话就返回;如果待查元素要比根节点小,就进行左子树递归查找;如果待查元素要比根节点大,就进行右子树的递归查找;如果查找到最后还没有一个符合的元素,就返回null。
递归查找
递归查找的方式有很多,有层序遍历、前序遍历、中序遍历和后序遍历。我这里就举后面三个遍历方式。
Code
如果代码是下面这样写的,那它遍历过程是怎么样的?看下面动画。
查找类算法之二分搜索树 | 算法必看系列十
动画:前序遍历
(响应读者的建议,动画不放BGM了)

动画:前中后遍历

从上面动画就发现,通过中序遍历得到的正好是一个升序序列。如果不考虑升序,后序遍历也能够为二分搜索树早点释放内存,早点减少栈的使用空间。
Code
查找类算法之二分搜索树 | 算法必看系列十
添加元素
对于二叉树的添加和删除元素,使用链表存储形式比较好操作的,如果使用数组形式存储,删除某一个有子树的元素会引发一系列的位置改变,涉及到交换元素的位置,性能也比链表的小。所以待会后面出现的伪代码都以链表存储形式去操作。
Code
查找类算法之二分搜索树 | 算法必看系列十
删除元素:删除最小和最大的元素
删除最小和最大的元素很简单,如果是删除最小的元素,从二叉树的顶点出发,一直递归它的左孩子,直到某节点的左孩子为空,这时候这个节点就是最小的元素。删除最大的元素也是一样的,一直递归它的右孩子,直到某节点的右孩子为空。
删除任意元素
如果删除任意元素,而这元素正好有左右子树的,那该是怎么办呢?

1962年,Hibbard提出了HibbardDeletion的解决方法。

看到Hibbard名字就想起来,我在希尔排序介绍过Hibbard增量序列,也把它相应的公式通过代码体现出来,代替希尔增量序列去进行希尔排序,最坏时间复杂度也比希尔增量序列的要小。

回到删除有左右子树的元素,想想它的左右子树也属于二叉排序树(也是二分搜索树),它左子树的最大值比它小,它右子树的最小值比它大。所以不管选择左子树的最大值还是选择右子树的最小值,替换掉要删除的元素,整个二叉树都是符合二分搜索树的规则。
动画:删除元素

Code:删除任意元素
查找类算法之二分搜索树 | 算法必看系列十
支持重复元素的二分搜索树
二分搜索树有一个规则是:没有键值相等的节点。那么就不建议把待添加的元素跳过值相等的节点,到下一步继续比较直到插入新的节点。比如我想插入23,插完之后上有23,下有23,那查找就没有意义了,也破坏了时间复杂度上的O(logn)。

建议就是在节点上加一个属性:count。当插入23的时候,count就可以自算++。这不仅满足了没有键值相等的规则,也满足时间复杂度的期望值。
查找类算法之二分搜索树 | 算法必看系列十
Code
查找类算法之二分搜索树 | 算法必看系列十

--END--

来源 | 算法无遗测
作者 | 我脱下短袖

上一篇:氚云第三方连接Webservice


下一篇:MongoDB 5.0.5