剑指offer:数据流中的中位数

题目描述:

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。

 

思路分析:

思路一:最朴素的想法,用一个vector来存输入的数据流。在取中位数的函数中,每次对数据流进行一次排序,对于奇数长度的数据,直接取中间值,对于偶数长度的数据,取中间两个数的平均值。很显然,这个方法是不能令人满意的。对于每一次新加入一个数据后,都需要重新进行一次排序,那么对于n个输入的n次查询,时间复杂度就会达到O(n^2logn),是不可接受的。

 

思路二:实际上,比较多的解法是考虑用堆来实现这个算法,分别维护一个最大堆和一个最小堆。保持两个堆中的数据个数相等,堆内部不需要排序,最大堆中的数始终小于最小堆中的数。同时约定,当总数据个数为偶数时,再有一个数加入,都往最小堆加,加入后,再取出最小堆中的第一个元素即最小值,加入到最大堆中。当为奇数时,先加入最大堆,再将最大堆的首元素即最大值取出加入最小堆。这样,当总数为奇数时,中位数为最大堆中的首元素,当为偶数时,分别取两个堆的首元素再求平均。

 

代码:

思路一:

 1 class Solution {
 2 public:
 3     vector<int> DataStream;
 4     void Insert(int num)
 5     {
 6         DataStream.push_back(num);
 7     }
 8 
 9     double GetMedian()
10     { 
11         sort(DataStream.begin(), DataStream.end());
12         int len = DataStream.size();
13         double res;
14         if(len%2==1)
15             res = DataStream[len/2];
16         else
17             res = (DataStream[len/2-1]+DataStream[len/2])/2.0;
18         return res;
19     }
20 
21 };

 

思路二:

 1 class Solution {
 2 public:
 3     vector<int> min;
 4     vector<int> max;
 5     int count = 0;
 6     void Insert(int num)
 7     {
 8         if(count%2 == 0)
 9         {
10             min.push_back(num);
11             push_heap(min.begin(), min.end(), greater<int>());
12             max.push_back(min[0]);
13             push_heap(max.begin(), max.end(), less<int>());
14             pop_heap(min.begin(), min.end(), greater<int>());
15             min.pop_back();
16         }
17         else
18         {
19             max.push_back(num);
20             push_heap(max.begin(), max.end(), less<int>());
21             min.push_back(max[0]);
22             push_heap(min.begin(), min.end(), greater<int>());
23             pop_heap(max.begin(), max.end(), less<int>());
24             max.pop_back();
25         }
26         count++;
27     }
28 
29     double GetMedian()
30     { 
31         if(count%2==1)
32             return double(max[0]);
33         else
34             return double((min[0]+max[0])/2.0);
35     }
36 
37 };

 

上一篇:Flink基础(五):Flink 流处理 API


下一篇:yelp纽约地区数据爬取。使用feapder爬虫框架