692. 前K个高频单词

692. 前K个高频单词

给一非空的单词列表,返回前 k 个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。

示例 1:

输入: ["i", "love", "leetcode", "i", "love", "coding"], k = 2
输出: ["i", "love"]
解析: "i" 和 "love" 为出现次数最多的两个单词,均为2次。
    注意,按字母顺序 "i" 在 "love" 之前。
 

示例 2:

输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
输出: ["the", "is", "sunny", "day"]
解析: "the", "is", "sunny" 和 "day" 是出现次数最多的四个单词,
    出现次数依次为 4, 3, 2 和 1 次。
 

注意:

假定 k 总为有效值, 1 ≤ k ≤ 集合元素数。
输入的单词均由小写字母组成。
 

扩展练习:

尝试以 O(n log k) 时间复杂度和 O(n) 空间复杂度解决。

方法1:Hash+桶计数

        public List<String> topKFrequent(String[] words, int k) {
            List<String> resList = new ArrayList<>();
            if (words == null || words.length == 0) {
                return resList;
            }
            Map<String, Integer> map = new HashMap<>();
            for (String word : words) {
                map.put(word, map.getOrDefault(word, 0) + 1);
            }
            List<String>[] bucket = new List[words.length + 1];
            for (Map.Entry<String, Integer> entry : map.entrySet()) {
                int count = entry.getValue();
                if (bucket[count] == null) {
                    bucket[count] = new ArrayList<>();
                }
                bucket[count].add(entry.getKey());
            }
            for (List<String> list : bucket) {
                if (list != null) {
                    Collections.sort(list);
                }
            }
            flag:
            for (int i = bucket.length - 1; i >= 0 && resList.size() < k; i--) {
                if (bucket[i] != null) {
                    for (String item : bucket[i]) {
                        if (resList.size() == k) {
                            break flag;
                        }
                        resList.add(item);
                    }
                }
            }
            return resList;
        }

方法2:优先队列+Hash

public List<String> topKFrequent(String[] words, int k) {
            Map<String, Integer> map = new HashMap<>();
            for (String word : words) {
                map.put(word, map.getOrDefault(word, 0) + 1);
            }
            PriorityQueue<Object[]> pq = new PriorityQueue<Object[]>(k, (o1, o2) -> {
                int freq1 = (Integer) o1[0], freq2 = (Integer) o2[0];
                if (freq1 != freq2) return freq1 - freq2;
                String word1 = (String) o1[1], word2 = (String) o2[1];
                return word2.compareTo(word1);
            });
            for (String word1 : map.keySet()) {
                int freq1 = map.get(word1);
                if (pq.size() < k) {
                    pq.add(new Object[]{freq1, word1});
                } else {
                    Object[] cur = pq.peek();
                    int freq2 = (Integer) cur[0];
                    String word2 = (String) cur[1];
                    if (freq1 > freq2) {
                        pq.poll();
                        pq.add(new Object[]{freq1, word1});
                    } else if (freq1 == freq2) {
                        if (word1.compareTo(word2) < 0) {
                            pq.poll();
                            pq.add(new Object[]{freq1, word1});
                        }
                    }
                }
            }
            List<String> res = new ArrayList<>();
            while (!pq.isEmpty()) res.add((String)pq.poll()[1]);
            Collections.reverse(res);
            return res;
        }
上一篇:爬虫之PyQuery库的使用(八)


下一篇:[JLOI2011]飞行路线