LeetCode-H-Index I & II

先看第一题 array unsorted 

我自己想到的方法是先排序 然后从后面开始找 找到一个数字<它对应的id 就应该返回它上一个数字 具体的id怎样算 见代码 o(nlogn) 时间  o(1)空间

index      0 1 2 3 4 

number  0 1 3 5 6

id           5 4 3 2 1

public class Solution {
    public int hIndex(int[] citations) {
        Arrays.sort(citations);
        for ( int i = citations.length - 1; i >= 0; i --){
            if ( citations[i] < citations.length - i )
                return citations.length - i - 1;
        }
        return citations.length;
    }
    
}

答案中有一个o(n)时间 o(n)空间的

记录一个计数数组 然后从计数数组后面开始累加 

public class Solution {
    public int hIndex(int[] citations) {
        int n = citations.length;
        int [] arr = new int [n + 1];
        for ( int i = 0; i < n; i ++ ){
            if ( citations[i] >= n )
                arr[ n ] ++;
            else
                arr[ citations[i] ] ++;
        }
        int addUp = 0;
        for ( int i = n; i >= 0; i -- ){
            addUp += arr[ i ];
            if ( addUp >= i )
                return i;
        }
        return 0;
    }
}
然后第二题就是给出了sorted array 用binary search更好!!!o(lgn)!!!

H-Index 是一种用于衡量科研人员学术影响力的重要指标,由 Jorge E. Hirsch 在 2005 年提出。它不仅被广泛应用于科研评价中,也被扩展到其他领域,比如算法题中常用来评估一个研究者发表的论文质量分布。 --- ## 🧠 H-Index 的定义: &gt; 一个研究者的 **H-Index** 是一个整数 `h`,表示他至少有 `h` 篇论文分别被引用了至少 `h` 次。 ### ✅ 示例说明: 假设某研究者发表了如下几篇论文(按引用次数排列): ``` [3, 0, 6, 1, 5] ``` 排序后变为降序: ``` [6, 5, 3, 1, 0] ``` 我们从前往后找最大的 `h`,使得第 `h` 篇论文的引用次数 &ge; `h`: | h | 第 h 篇论文引用次数 | |---|------------------| | 1 | 6 &ge; 1 ✔️ | | 2 | 5 &ge; 2 ✔️ | | 3 | 3 &ge; 3 ✔️ | | 4 | 1 &lt; 4 ✖️ | ✅ 所以这个人的 H-Index 是 `3`。 --- ## 🔍 解决的问题类型: H-Index 主要解决的是: &gt; 在一组数据中,找到最大整数 `h`,使得至少有 `h` 个元素的值大于等于 `h`。 这类问题可以抽象为以下几种场景: - 科研成果评估:有多少篇论文至少被引用多少次。 - 数据分布分析:找出某个阈值以上的有效数量。 - 排名类问题:如&ldquo;有多少篇文章的阅读量超过一定数值&rdquo;。 --- ## 📈 解法思路 ### 方法一:排序 + 遍历(最常用) #### 步骤: 1. 对数组进行 **降序排序**。 2. 遍历排序后的数组,找到满足条件的最大 `i`,使得 `citations[i] &gt;= i+1`。 3. 返回最大的 `i+1` 就是 H-Index。 #### ✅ 示例代码(C++): ```cpp int hIndex(vector&lt;int&gt;&amp; citations) { sort(citations.rbegin(), citations.rend()); int h = 0; for (int i = 0; i &lt; citations.size(); ++i) { if (citations[i] &gt;= i + 1) h = i + 1; else break; } return h; } ``` #### 💡 示例解释: 输入: ```cpp [3, 0, 6, 1, 5] ``` 排序后: ```cpp [6, 5, 3, 1, 0] ``` 遍历判断: - i=0: 6 &ge; 1 &rarr; h=1 - i=1: 5 &ge; 2 &rarr; h=2 - i=2: 3 &ge; 3 &rarr; h=3 - i=3: 1 &lt; 4 &rarr; 停止 返回 `3` ✅ --- ### 方法二:计数排序优化(线性时间) 当引用次数范围有限时,我们可以使用桶排序思想来优化性能。 #### 步骤: 1. 创建大小为 n+1 的计数数组 `bucket`。 2. 统计每个引用次数出现的次数。 3. 从后往前累加,直到找到 `bucket[i] &gt;= i` 的最大 `i`。 #### ✅ 示例代码(C++): ```cpp int hIndex(vector&lt;int&gt;&amp; citations) { int n = citations.size(); vector&lt;int&gt; bucket(n + 1, 0); for (int c : citations) { if (c &gt;= n) bucket[n]++; else bucket[c]++; } int count = 0; for (int i = n; i &gt;= 0; --i) { count += bucket[i]; if (count &gt;= i) return i; } return 0; } ``` --- ## 🎯 应用场景总结 | 场景 | 是否适用 H-Index 思想 | |------|------------------------| | 学术评价 | ✅ 典型应用场景 | | 论文影响力分析 | ✅ | | LeetCode 算法题 | ✅ 如 H-Index I/II | | 推荐系统中的热度评估 | ✅ 可类比 | | 用户评分分布统计 | ✅ 可类比 | | 无序数据中找阈值 | ✅ 抽象为 H-Index 问题即可 | --- ## 📚 相关题目推荐(LeetCode) | 题号 | 标题 | 类型 | |------|------|------| | [274. H-Index](https://leetcode.cn/problems/h-index/) | 经典 H-Index | 数组、排序 | | [275. H-Index II](https://leetcode.cn/problems/h-index-ii/) | 已排序版本 | 二分查找 | | [354. Russian Doll Envelopes](https://leetcode.cn/problems/russian-doll-envelopes/) | 类似思想 | 动态规划 | | [69. Sqrt(x)](https://leetcode.cn/problems/sqrtx/) | 二分查找类比 | 二分法 | --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值