leetcode 692. 前K个高频单词

最新推荐文章于 2025-03-05 02:52:57 发布

原创最新推荐文章于 2025-03-05 02:52:57 发布 · 546 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#leetcode #排序算法 #算法 #stl #数据结构

leetcode 专栏收录该内容

17 篇文章

订阅专栏

本文介绍如何使用C++实现统计给定单词列表中前k个出现最频繁的单词，按频率降序并保持字典序。通过map和multimap的数据结构，确保稳定性和效率。

给定一个单词列表 words 和一个整数 k ，返回前 k 个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率，按字典顺序排序。

示例 1：

输入: words = [“i”, “love”, “leetcode”, “i”, “love”, “coding”], k = 2
输出: [“i”, “love”] 解析: “i” 和 “love” 为出现次数最多的两个单词，均为2次。
注意，按字母顺序 “i” 在 “love” 之前。

示例 2：

输入: [“the”, “day”, “is”, “sunny”, “the”, “the”, “the”, “sunny”, “is”,“is”], k = 4
输出: [“the”, “is”, “sunny”, “day”]
解析: “the”, “is”, “sunny” 和 “day” 是出现次数最多的四个单词，
出现次数依次为 4, 3, 2 和 1 次。

注意：

1 <= words.length <= 500
1 <= words[i] <= 10
words[i] 由小写英文字母组成。
k 的取值范围是 [1, 不同 words[i] 的数量]

思路：

统计单词列表 words中单词出现的次数
再按次数排序（由大到小排序），这样使得相同次数的单词顺序不会打乱，相当于是稳定的
将排序好的前k个单词，放入到vector < string > 数组中即可

代码如下：

class Solution {
public:
    vector<string> topKFrequent(vector<string>& words, int k) 
    {
        //统计次数，string按字典序排序
        map<string,int> countmap;
        for(const auto e:words)
        {
            countmap[e]++;
        }
        //按次数排序，相同次数的单词顺序不会打乱，相当于是稳定的
        multimap <int,string,greater<int>> sortmap;
        for(const auto e:countmap)
        {
            sortmap.insert(make_pair(e.second,e.first));
        }
        vector<string> ret;
        for(const auto e:sortmap)
        {
            ret.push_back(e.second);
            if(--k==0)   //前K个高频单词放入到ret
                break;
        }
        return ret; 
    }
};