给一非空的单词列表,返回前 k 个出现次数最多的单词。
返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。
示例 1:
输入: ["i", "love", "leetcode", "i", "love", "coding"], k = 2 输出: ["i", "love"] 解析: "i" 和 "love" 为出现次数最多的两个单词,均为2次。 注意,按字母顺序 "i" 在 "love" 之前。
示例 2:
输入: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4 输出: ["the", "is", "sunny", "day"] 解析: "the", "is", "sunny" 和 "day" 是出现次数最多的四个单词, 出现次数依次为 4, 3, 2 和 1 次。
注意:
- 假定 k 总为有效值, 1 ≤ k ≤ 集合元素数。
- 输入的单词均由小写字母组成。
扩展练习:
- 尝试以 O(n log k) 时间复杂度和 O(n) 空间复杂度解决。
思路:这道题和Top K Frequent Elements 前K个高频元素的解题思路完全一样,只是把统计次数的泛型由char变成string,我们需要一个map来统计对应字符串出现的次数,然后把map里的字符串丢到最大堆中,并且按照出现的次数排序(次数相同就按照ascll码排序),最后取出最大堆中的top k个元素即可。
参考代码:
class Solution {
public:
struct cmp {
bool operator () (pair<int, string> &a, pair<int, string> &b) {
if (a.first < b.first) return true;
if (a.first > b.first) return false;
return (a.second.compare(b.second))>0;
}
};
vector<string> topKFrequent(vector<string>& words, int k) {
vector<string> res;
unordered_map<string, int> count;
priority_queue<pair<int, string>, vector<pair<int, string>>, cmp> great_heap;
for (auto word : words) count[word]++;
for (auto it = count.begin(); it != count.end(); it++) great_heap.push({ it->second,it->first });
int n = (int)great_heap.size();
for (int i = 0; i < (min(n, k)); i++) {
res.push_back(great_heap.top().second);
great_heap.pop();
}
return res;
}
};