leetcode之H-Index

本文介绍了学术界用于衡量学者影响力的一种指标——H指数,并提供了一个简单的Python实现方法。通过排序作者发表论文的引用次数来确定H指数的具体数值。

查了百度发现这个H指数是用来形容一个人的学术成就的,就是将他发表的文章列个表排序一下,被引用的次数大于等于文章的排序。就是排列第3个的文章的引用数要大于等于3才行。感觉很简单,但是不知道为啥分类是Mediem。代码如下:

def hIndex(citations):
    """
    :type citations: List[int]
    :rtype: int
    """
    a = sorted(citations, reverse = True)
    for i in range(len(a)):
    	if a[i] < i + 1:
    		return i
    else:
    	return len(a)
print hIndex([0])


H-Index 是一种用于衡量科研员学术影响力的重要指标,由 Jorge E. Hirsch 在 2005 年提出。它不仅被广泛应用于科研评价中,也被扩展到其他领域,比如算法题中常用来评估一个研究者发表的论文质量分布。 --- ## 🧠 H-Index 的定义: > 一个研究者的 **H-Index** 是一个整数 `h`,表示他至少有 `h` 篇论文分别被引用了至少 `h` 次。 ### ✅ 示例说明: 假设某研究者发表了如下几篇论文(按引用次数排列): ``` [3, 0, 6, 1, 5] ``` 排序后变为降序: ``` [6, 5, 3, 1, 0] ``` 我们从前往后找最大的 `h`,使得第 `h` 篇论文的引用次数 ≥ `h`: | h | 第 h 篇论文引用次数 | |---|------------------| | 1 | 6 ≥ 1 ✔️ | | 2 | 5 ≥ 2 ✔️ | | 3 | 3 ≥ 3 ✔️ | | 4 | 1 < 4 ✖️ | ✅ 所以这个的 H-Index 是 `3`。 --- ## 🔍 解决的问题类型: H-Index 主要解决的是: > 在一组数据中,找到最大整数 `h`,使得至少有 `h` 个元素的值大于等于 `h`。 这类问题可以抽象为以下几种场景: - 科研成果评估:有多少篇论文至少被引用多少次。 - 数据分布分析:找出某个阈值以上的有效数量。 - 排名类问题:如“有多少篇文章的阅读量超过一定数值”。 --- ## 📈 解法思路 ### 方法一:排序 + 遍历(最常用) #### 步骤: 1. 对数组进行 **降序排序**。 2. 遍历排序后的数组,找到满足条件的最大 `i`,使得 `citations[i] >= i+1`。 3. 返回最大的 `i+1` 就是 H-Index。 #### ✅ 示例代码(C++): ```cpp int hIndex(vector<int>& citations) { sort(citations.rbegin(), citations.rend()); int h = 0; for (int i = 0; i < citations.size(); ++i) { if (citations[i] >= i + 1) h = i + 1; else break; } return h; } ``` #### 💡 示例解释: 输入: ```cpp [3, 0, 6, 1, 5] ``` 排序后: ```cpp [6, 5, 3, 1, 0] ``` 遍历判断: - i=0: 6 ≥ 1 → h=1 - i=1: 5 ≥ 2 → h=2 - i=2: 3 ≥ 3 → h=3 - i=3: 1 < 4 → 停止 返回 `3` ✅ --- ### 方法二:计数排序优化(线性时间) 当引用次数范围有限时,我们可以使用桶排序思想来优化性能。 #### 步骤: 1. 创建大小为 n+1 的计数数组 `bucket`。 2. 统计每个引用次数出现的次数。 3. 从后往前累加,直到找到 `bucket[i] >= i` 的最大 `i`。 #### ✅ 示例代码(C++): ```cpp int hIndex(vector<int>& citations) { int n = citations.size(); vector<int> bucket(n + 1, 0); for (int c : citations) { if (c >= n) bucket[n]++; else bucket[c]++; } int count = 0; for (int i = n; i >= 0; --i) { count += bucket[i]; if (count >= i) return i; } return 0; } ``` --- ## 🎯 应用场景总结 | 场景 | 是否适用 H-Index 思想 | |------|------------------------| | 学术评价 | ✅ 典型应用场景 | | 论文影响力分析 | ✅ | | LeetCode 算法题 | ✅ 如 H-Index I/II | | 推荐系统中的热度评估 | ✅ 可类比 | | 用户评分分布统计 | ✅ 可类比 | | 无序数据中找阈值 | ✅ 抽象为 H-Index 问题即可 | --- ## 📚 相关题目推荐(LeetCode) | 题号 | 标题 | 类型 | |------|------|------| | [274. H-Index](https://leetcode.cn/problems/h-index/) | 经典 H-Index | 数组、排序 | | [275. H-Index II](https://leetcode.cn/problems/h-index-ii/) | 已排序版本 | 二分查找 | | [354. Russian Doll Envelopes](https://leetcode.cn/problems/russian-doll-envelopes/) | 类似思想 | 动态规划 | | [69. Sqrt(x)](https://leetcode.cn/problems/sqrtx/) | 二分查找类比 | 二分法 | --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值