leetcode 之 H-index

本文详细解析了H-index问题的核心概念及其边界处理,并通过快速排序算法实现了解题过程。提供了代码实现,适合算法练习和面试准备。

继续刷题,H-index这道题不难,但是要理清思路,明白h值的具体含义,其中包含了很多种边界情况都要分别加以讨论,这些都体现在代码中。

       分析题目:首先利用快速排序把数组排好序;然后,从后向前找到合适的h值,要注意对于边界的处理。总的来说,题目很简单,就当是练练手。

下面贴上leetcode accept的代码:

  

#include<stdio.h>
#include<stdlib.h>
void quicksort(int s[], int l, int r)
{
    int i, j, x;
    if (l < r)
    {
        i = l;
        j = r;
        x = s[i];
        while (i < j)
        {
            while(i < j && s[j] > x) j--; 
            if(i < j) s[i++] = s[j];
            while(i < j && s[i] < x) i++; 
            if(i < j) s[j--] = s[i];
        }
        s[i] = x;
        quicksort(s, l, i-1); 
        quicksort(s, i+1, r);
    }
}

int hIndex(int* citations, int citationsSize) {
	quicksort(citations,0,citationsSize-1);
	int count=0;
	if(citationsSize==0) return 0;
	for(int i=citationsSize-1;i>=0;i--)
	{
	    if(citationsSize==1)
		{
			if(citations[0]>0)return 1;
			else return 0;
		}
	
		else if(count>=citations[i])
		{
		
			return count;
	    	
		}
        ++count;
        if(count==citationsSize)
			  return count;
	}
    
}

H-Index 是一种用于衡量科研人员学术影响力的重要指标,由 Jorge E. Hirsch 在 2005 年提出。它不仅被广泛应用于科研评价中,也被扩展到其他领域,比如法题中常用来评估一个研究者发表的论文质量分布。 --- ## 🧠 H-Index 的定义: > 一个研究者的 **H-Index** 是一个整数 `h`,表示他至少有 `h` 篇论文分别被引用了至少 `h` 次。 ### ✅ 示例说明: 假设某研究者发表了如下几篇论文(按引用次数排列): ``` [3, 0, 6, 1, 5] ``` 排序后变为降序: ``` [6, 5, 3, 1, 0] ``` 我们从前往后找最大的 `h`,使得第 `h` 篇论文的引用次数 ≥ `h`: | h | 第 h 篇论文引用次数 | |---|------------------| | 1 | 6 ≥ 1 ✔️ | | 2 | 5 ≥ 2 ✔️ | | 3 | 3 ≥ 3 ✔️ | | 4 | 1 < 4 ✖️ | ✅ 所以这个人的 H-Index 是 `3`。 --- ## 🔍 解决的问题类型: H-Index 主要解决的是: > 在一组数据中,找到最大整数 `h`,使得至少有 `h` 个元素的值大于等于 `h`。 这类问题可以抽象为以下几种场景: - 科研成果评估:有多少篇论文至少被引用多少次。 - 数据分布分析:找出某个阈值以上的有效数量。 - 排名类问题:如“有多少篇文章的阅读量超过一定数值”。 --- ## 📈 解法思路 ### 方法一:排序 + 遍历(最常用) #### 步骤: 1. 对数组进行 **降序排序**。 2. 遍历排序后的数组,找到满足条件的最大 `i`,使得 `citations[i] >= i+1`。 3. 返回最大的 `i+1` 就是 H-Index。 #### ✅ 示例代码(C++): ```cpp int hIndex(vector<int>& citations) { sort(citations.rbegin(), citations.rend()); int h = 0; for (int i = 0; i < citations.size(); ++i) { if (citations[i] >= i + 1) h = i + 1; else break; } return h; } ``` #### 💡 示例解释: 输入: ```cpp [3, 0, 6, 1, 5] ``` 排序后: ```cpp [6, 5, 3, 1, 0] ``` 遍历判断: - i=0: 6 ≥ 1 → h=1 - i=1: 5 ≥ 2 → h=2 - i=2: 3 ≥ 3 → h=3 - i=3: 1 < 4 → 停止 返回 `3` ✅ --- ### 方法二:计数排序优化(线性时间) 当引用次数范围有限时,我们可以使用桶排序思想来优化性能。 #### 步骤: 1. 创建大小为 n+1 的计数数组 `bucket`。 2. 统计每个引用次数出现的次数。 3. 从后往前累加,直到找到 `bucket[i] >= i` 的最大 `i`。 #### ✅ 示例代码(C++): ```cpp int hIndex(vector<int>& citations) { int n = citations.size(); vector<int> bucket(n + 1, 0); for (int c : citations) { if (c >= n) bucket[n]++; else bucket[c]++; } int count = 0; for (int i = n; i >= 0; --i) { count += bucket[i]; if (count >= i) return i; } return 0; } ``` --- ## 🎯 应用场景总结 | 场景 | 是否适用 H-Index 思想 | |------|------------------------| | 学术评价 | ✅ 典型应用场景 | | 论文影响力分析 | ✅ | | LeetCode 法题 | ✅ 如 H-Index I/II | | 推荐系统中的热度评估 | ✅ 可类比 | | 用户评分分布统计 | ✅ 可类比 | | 无序数据中找阈值 | ✅ 抽象为 H-Index 问题即可 | --- ## 📚 相关题目推荐(LeetCode) | 题号 | 标题 | 类型 | |------|------|------| | [274. H-Index](https://leetcode.cn/problems/h-index/) | 经典 H-Index | 数组、排序 | | [275. H-Index II](https://leetcode.cn/problems/h-index-ii/) | 已排序版本 | 二分查找 | | [354. Russian Doll Envelopes](https://leetcode.cn/problems/russian-doll-envelopes/) | 类似思想 | 动态规划 | | [69. Sqrt(x)](https://leetcode.cn/problems/sqrtx/) | 二分查找类比 | 二分法 | --- ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值