力扣题目——692. 前K个高频单词

该博客介绍了如何从给定的单词列表中提取出现频率最高的前k个单词。首先,利用HashMap统计每个单词的出现次数,然后通过自定义比较器对单词进行排序,最后返回按频率和字母顺序排列的前k个单词。这种方法适用于高效地处理大量文本数据。

1. 题目描述

  1. 前K个高频单词

给一非空的单词列表,返回前 k 个出现次数最多的单词。返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。

2. 代码实现

class Solution {
 public List<String> topKFrequent(String[] words, int k) {
        // 1. 先统计每个单词出现的次数
        Map<String, Integer> map = new HashMap<>();
        for (String word : words) {
            Integer value = map.getOrDefault(word, 0);
            map.put(word, value + 1);
        }
        // 2. 此处直接使用排序实现. 使用优先队列也阔以, 但是代码稍微更麻烦一些
        List<String> wordList = new ArrayList<>(map.keySet());
        Collections.sort(wordList, new Comparator<String>() {
            @Override
            public int compare(String o1, String o2) {
                // 变量捕获~ 匿名内部类, 可以直接使用外部的变量~~
                // 本质上相当于编译器自动给该匿名内部类创建了一个同名同类型的属性
                // 并且在实例化的时候自动进行了传参~~
                int count1 = map.get(o1);
                int count2 = map.get(o2);
                if (count1 == count2) {
                    // 如果出现次数相同, 就按照 String 的默认比较规则排序
                    return o1.compareTo(o2);
                }
                return count2 - count1;
            }
        });
        return wordList.subList(0, k);
        }
}

3. 结果

在这里插入图片描述

力扣平台出现Out of memory错误,通常是由于代码在运行过程中消耗了过多的内存资源。以下是一些常见的解决办法: ### 优化数据结构 - **减少不必要的存储**:避免使用过大的数组或列表来存储数据。例如,如果只需要处理当元素和一个元素,就不需要将所有元素都存储在数组中。 ```python # 斐波那契数列,避免使用数组存储所有结果 def fibonacci(n): if n <= 1: return n a, b = 0, 1 for _ in range(2, n + 1): a, b = b, a + b return b ``` ### 及时释放资源 - **使用`using`语句**:在C#中,如果使用了实现了`IDisposable`接口的对象,如文件流、数据库连接等,使用`using`语句可以确保对象在使用完后及时释放资源。 ```csharp using System.IO; class Program { static void Main() { using (StreamReader reader = new StreamReader("file.txt")) { string line = reader.ReadLine(); // 处理数据 } // reader对象在此处自动释放资源 } } ``` ### 优化算法复杂度 - **避免指数级复杂度的算法**:一些算法的时间和空间复杂度会随着输入规模的增大而呈指数级增长,尽量使用更高效的算法。例如,使用动态规划来解决一些递归问题,避免重复计算。 ```python # 爬楼梯问题,使用动态规划优化 def climbStairs(n): if n <= 2: return n dp = [0] * (n + 1) dp[1] = 1 dp[2] = 2 for i in range(3, n + 1): dp[i] = dp[i - 1] + dp[i - 2] return dp[n] ``` ### 分块处理数据 - **大数组分块处理**:如果需要处理大规模的数据,可以将数据分成小块进行处理,减少一次性占用的内存。 ```python # 大数组分块求和 def sum_large_array(arr): chunk_size = 1000 total_sum = 0 for i in range(0, len(arr), chunk_size): chunk = arr[i:i + chunk_size] total_sum += sum(chunk) return total_sum ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值