数据结构 之 二叉堆(Heap)

注:本节主要讨论最大堆(最小堆同理)。

一、堆的概念
    堆,又称二叉堆。同二叉查找树一样,堆也有两个性质,即结构性和堆序性。
    1、结构性质:
    堆是一棵被完全填满的二叉树,有可能的例外是在底层,底层上的元素从左到右填入。这样的树称为完全二叉树(complete binary tree)。下图就是这样一个例子。
    数据结构 之 二叉堆(Heap)
    对于完全二叉树,有这样一些性质:
    (1)、一棵高h的完全二叉树,其包含2^h ~ (2^(h+1) - 1)个节点。也就是说,完全二叉树的高是[logN],显然它是O(logN)。
    (2)、完全二叉树可以用数组进行结构表示:

index

0

1

2

3

4

5

6

7

8

9

10

11

12

13

value


A

B

C

D

E

F

G

H

I

J





    仔细考察该数组的index和元素在树中的分布情况,可以得到:
    对于一个三元素的二叉树,树结构和数组索引有如下关系:
    leftChild.index = 2 * parent.index;
    rightChild.index = 2 * parent.index + 1; 
    (3)、通过前面的讨论,我们可以这样去看待一个堆的数据结构:
    一个数组、当前堆的大小heapLen。
    2、堆序性质:
    使操作被快速执行的性质是堆序性(heap order)。
    堆序性质:在一个堆中,对于每一个节点x,x的父亲中的关键字大于(或等于)x中的关键字,根节点除外(它没有父节点)。
    根据堆序性质,最大元总可以在根处找到。因此,我们以常数时间完成查找操作。
    比较:
    堆序性质的堆:
    数据结构 之 二叉堆(Heap)
    无堆序性质的堆:
    数据结构 之 二叉堆(Heap)

二、基本堆操作

    声明:
    int heap[MAX+1];
    int heapLen; //堆的大小

    int leftEle(int i){ return i*2; }
    int rightEle(int i){ return i*2+1; }
    int parentEle(int i){ return i/2; }
    void swap(int i, int j){
        int tmp;
        tmp = i, i = j, j = tmp;
    }


    1、查询操作:    

    int findMax()
    {
        return heap[1];
    }

    函数解析:
    堆的最大值即为根节点元素,直接返回该值即可。


    2、堆维护操作:

    下沉操作:
    void maxHeapify(int i)
    {
        int iLeft = leftEle(i);    //找到该节点的左儿子
        int iRight = rightEle(i);    //找到该节点的右儿子
        int largest = i;    //记录最大值节点,初始为节点自己
        
        //找到最大值对应的节点
        if( iLeft < heapLen && heap[i] < heap[iLeft] )
            largest = iLeft;
        if(iRight < heapLen && heap[largest] < heap[iRight] )
            largest = iRight;
        
        //交换原节点与最大值对应的节点,然后对交换后的节点进行堆维护操作
        if(largest != i)
        {
            swap(heap[i], heap[largest]);
            maxHeapify(largest);
        }
    }


    3、建堆操作:    

    在给出具体如何建堆的操作之前,我们可以考察一下具体应该怎样去实现。
    现在给出一个堆(应该不能称之为堆),这个堆由初始数组构造而成,其结构为:
    数据结构 之 二叉堆(Heap)
    显然这不是最大堆。
    整个数组为:    
index
83
11
6
15
36
19
value
1
2
3
4
5
6
    经过一系列的操作,我们需要将该堆转换为:
    数据结构 之 二叉堆(Heap)
    整个最大堆化过程是这样的:自下而上逐层维护堆操作。
    首先,找到第一个有子树的节点,对该节点进行堆维护操作,然后依次向上,进行堆维护。

    这里的问题:
    第一个有子树的节点在哪里?
    ===>>>>>
    对于完全二叉树,叶子节点必然存放在数组的尾端,现在的问题就在于叶子节点到底有多少个?知晓叶子节点的个数后,就可以很容易地确定有子树节点的位置。那么叶子节点到底有多少个呢?
    设完全二叉树总共有n个节点,叶子节点有n0个,由于二叉树的节点的度数最大为2,于是可设度数为1的节点数为n1,度数为2的节点数为n2。
    于是我们可以得到这样几个关系式:
    n0+n1+n2 = n;
    n-1 = 2*n2 + n1;(边数的两种不同表示方式)
    解此方程式,可以得到:    
    n0 = (n+1-n1)/2.
    对于完全二叉树,n1 = 1或0
    当n1=1时,n0=n/2;当n1=0时,n0=(n+1)/2。
    于是我们可以得到叶子节点为总节点数的一半。
    从而有,非叶子节点应该是数组的前半部分。

    ===>>>
    void buildHeap()
    {    
        int i;
        for( i = heapLen/2; i > 0; i--)
            maxHeapify(i);
    }


    4、排序操作:    

    堆排序的关键在于将最大值元素交换到数组尾端,重新进行堆维护操作。依次循环操作,即可以得到排序的数组。
    void heapSort()
    {
        int i;
        buileHeap();
        for( i=heapLen; i>=1; i--)
        {
            swap(heap[heapLen], heap[1]);
            heapLen--;
            maxHeapify(1);
        }
    }
    
    函数解析:
    首先我们先利用堆排序对一数组中的元素进行排序:
23
1
16
9
54

数据结构 之 二叉堆(Heap)

    现在进行堆排序:
    a、建堆:
    数据结构 之 二叉堆(Heap)
    b、交换54和1,并解除堆最后一个元素与原堆的关系:
    数据结构 之 二叉堆(Heap)
    c、重构堆:
    数据结构 之 二叉堆(Heap)
    d、依次循环最终得到:
    数据结构 之 二叉堆(Heap)    
    这样,数组变为:
1
9
16
23
54

从而完成了对数组的排序。


    5、插入元素操作:    

    插入insertHeap():该操作同优先队列(priority queue)中的push操作。
    在介绍具体的插入操作前,需要实现increaseKey(int i, int key)函数,用于更新堆结构。
    上浮操作:
    void increaseKey(int i, int key)
    {
        assert(key >= heap[i]);    //断言key值大于heap[i],如果不成立,则终止并报错
        heap[i] = key;
        while(i > 1 && heap[parentEle(i)] < heap[i])
        {
            swap(heap[i], heap[parentEle(i)]);
            i = parentEle(i);
        }
    }
    在这里,需要着重介绍一下increaseKey操作的具体步骤,举例说明:
    对于这样一个堆,将节点6的值由8增加到54—>>>:
    数据结构 之 二叉堆(Heap)
    整个操作过程即为increaseKey(6, 54)。
    整个过程如下:
    数据结构 之 二叉堆(Heap)
    于是,插入元素到堆的代码如下:
    void insertHeap( int x )
    {
        heapLen++;
        heap[heapLen] = -INF;
        increaseKey(heapLen, x);
    }

    6、删除元素操作:

    删除deleteHeapMax():相当于优先队列中的pop()操作。
    int deleteHeapMax()
    {
        int ret = heap[1];
        swap(ret, heap[heapLen]);
        heapLen--;
        maxHeapify(1);
        return ret;
    }


三、算法分析:
查询操作
O(1)
堆维护操作
O(logN)
建堆操作
O(NlogN)
堆排序操作
O(NlogN)

上一篇:mv,Directory not empty不能目录覆盖


下一篇:读《你不知道的JavaScript(上卷)》后感-浅谈JavaScript作用域(一)