排序算法-计数排序

一、计数排序

       这种排序算法 是利用数组下标来确定元素的正确位置的。

      如果数组中有20个随机整数,取值范围为0~10,要求用最快的速度把这20个整数从小到大进行排序。 很大的情况下,它的性能甚至快过那些时间复杂度为O(nlogn)的排序。

    9,3,5,4,9,1,2,7,8,1,3,6,5,3,4,0,10,9,7,9

   考虑到这些整数只能够在0、1、2、3、4、5、6、7、8、9、10这11个数中取值,取值范围有限。可以根据这有限的范围,建立一个长度为11的数组。数组下标从0到10,元素初始值全为0

    下面就开始遍历这个无序的随机数列,每一个整数按照其值对号入座,同时对应数组下标元素进行加1操作。

    根据这个统计结果,排序就很简单了。直接遍历数组,输出数组元素的下标 值,元素的值是几,就输出几次: 0,1,1,2,3,3,3,4,4,5,5,6,7,7,8,9,9,9,9,10

    计数排序的基本过程,它适用于一定范围内的整数排序。在取值范围不是 很大的情况下,它的性能甚至快过那些时间复杂度为O(nlogn)的排序。

def countSort(ll):
    # 1.得到数列的最大值
    max=ll[0]
    for i in range(1,len(ll)):
        if ll[i]>max:
            max=ll[i]
    # print(max)
    # 2.根据数列最大值确定统计数组大小,并赋值0;
    arrs=[0]*(max+1)
    print(arrs)
    # 3.遍历数列,填充统计数组
    for i in range(len(arrs)):
        arrs[ll[i]]+=1
    print(arrs)
    # 4.遍历数列
    sorted_arrs=[]
    for i in range(len(arrs)):
        for j in range(0,arrs[i]):
            # print(i)
           sorted_arrs.append(i)
    #返回排序数组
    return sorted_arrs

if __name__ == '__main__':
    ll=[9,3,5,4,9,1,2,7,8,1,10]
    print(ll)
    print(countSort(ll))

 

以上是找数列的最大值来决定统计数组的长度,其实并不严谨 。

如: 96,93,91,94,95,90,99, 93,91,90

这个数列的最大值是99,但最小的整数是90。如果创建长度为100的数组,那么前面从0到89的空间位置就都浪费了!

    很简单,只要不再以输入数列的最大值+1作为统计数组的长度,而是以数列最大值-最小值+1作为统计数组的长度即可。 同时数列的最小值作为一个偏移量,用于计算整数在统计数组中的下标。 

统计出数组的长度:99-90+1=10,偏移量等于数列的最小值90对于第1个整数96,对应的统计数组下标是96-90=6

如下图所示: 同时数列的最小值作为一个偏移量,用于计算整数在统计数组中的下标。 

 如果学生成绩表,要求按成绩从低到高进行排序,如果成绩相同,则遵循原表固有顺序。

 如图所示:

这是变形,其实就是从统计数组的第2个元素开始,每一个元素都加上前面所有元素之和。 

步骤1:遍历成绩表最后一行的小绿同学的成绩。

小绿的成绩是95分,找到count_array下标是5的元素,值是4,代表小绿的成绩排名位置在第4位。 同时,给count_array下标是5的元素值减1,从4变成3,代表下次再遇到95分的成绩时,最终排名是第3。 

 

步骤2:遍历成绩表倒数第二行的小白同学的成绩。 

 

步骤3:遍历成绩表倒数第三行的小红同学的成绩。  

 

重复上面的步骤继续完成! 

'''优化'''
def countSort2(ll):
    # 1.得到数列的最大值,最小值
    max=ll[0]
    min=ll[0]
    for i in range(1,len(ll)):
        if ll[i]>max:
            max=ll[i]
        if ll[i]<min:
            min=ll[i]
    #差值
    diff=max-min
    # print(diff)
    # 2.确定统计数组大小,并赋值0;
    arrs=[0]*(diff+1)
    # print(arrs)
    # 3.遍历数列,填充统计数组
    for i in range(len(ll)):
        arrs[ll[i]-min]+=1   #如:95-90=5,94-90=4
    print(arrs)
    # 4.统计数组变形,从第二个元素开始,后面的元素等于前面的元素之和
    for i in range(1,len(ll)):
        arrs[i]+=arrs[i-1]  #1+2,3+1,4+1...
    print(arrs)
    # 5.排序数列
    sorted_arrs=[0]*len(ll)
    # 倒序遍历原始数列,从统计数组找到正确位置
    for i in range(len(ll)-1,-1,-1):
        sorted_arrs[arrs[ll[i]-min]-1]=ll[i]  #92-90-1=1;1是排序数列下标,再将对应原始数据最后一个赋值到这个下标。
        arrs[ll[i] - min] -= 1    #arrs[92-90]-1=arrs[2]-1=1
        # #返回排序数组
    return sorted_arrs

if __name__ == '__main__':
    ll = [95,94,91,98,99,90,99,93,91,92]
    print(ll)
    print(countSort2(ll))

计数排序有它的局限性,主要表现两点:

1、当数列最大和最小值差距过大时,并不适合用计数排序。

    如:给出20个随机整数,范围在0到1亿之间,这时如果使用计数排序,需要创建长度为1亿的数组。不但严重浪费空间,而且时间复杂度也会随之升高。

2、当数列元素不是整数时,也不适合用计数排序。

  如果数列中的元素都是小数,如25.213或0.000001这样的数字,则无法创建对应的统计数组。

上一篇:基于随机森林和Xgboost对肥胖风险的多类别预测


下一篇:LT2611UX四端口 LVDS转 HDMI2.0,带音频-描述