题目
给你一个整数数组 citations ,其中 citations[i] 表示研究者的第 i 篇论文被引用的次数,citations 已经按照 非降序排列 。计算并返回该研究者的 h 指数。
h 指数的定义:h 代表“高引用次数”(high citations),一名科研人员的 h 指数是指他(她)的 (n 篇论文中)至少 有 h 篇论文分别被引用了至少 h 次。
请你设计并实现对数时间复杂度的算法解决此问题。

解析
来自百度百科的解释

开始总觉得要根据citations数组的元素来判断h指数,实际上h指数取决于citations数组的元素及元素的位置。
这题实际是对h的范围进行二分查找,最终确定h,而不是对citations数组进行二分查找。
citations数组实际只是在锁定h范围的二分查找时,做辅助判断用的。
参考来源:
h 指数是指(n 篇论文中)至少 有 h 篇论文分别被引用了至少 h 次。
所以要找到区间[0...n]中的一个数 h,满足citations数组中至少有h个元素的值大于等于h
因此这里是二分查找答案,而不是二分查找citations数组。
来源:
答案
class Solution:
def hIndex(self, citations: List[int]) -> int:
# 在区间 (left, right) 内询问
left = 0
right = len(citations) + 1
while left + 1 < right: # 区间不为空
# 循环不变量:
# left 的回答一定为「是」
# right 的回答一定为「否」
mid = (left + right) // 2
# 引用次数最多的 mid 篇论文,引用次数均 >= mid
if citations[-mid] >= mid:
left = mid # 询问范围缩小到 (mid, right)
else:
right = mid # 询问范围缩小到 (left, mid)
# 根据循环不变量,left 现在是最大的回答为「是」的数
return left
# 作者:灵茶山艾府
# 链接:https://leetcode.cn/problems/h-index-ii/solutions/2504326/tu-jie-yi-tu-zhang-wo-er-fen-da-an-si-ch-d15k/
# 来源:力扣(LeetCode)
# 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
复杂度分析
时间复杂度:O(logn),其中 n 为 citations 的长度。每次循环,都会将二分范围减少一半,所以循环会执行 O(logn) 次,所以时间复杂度为 O(logn)。
空间复杂度:O(1)。仅用到若干额外变量。作者:灵茶山艾府
链接:https://leetcode.cn/problems/h-index-ii/solutions/2504326/tu-jie-yi-tu-zhang-wo-er-fen-da-an-si-ch-d15k/
来源:力扣(LeetCode)


1062

被折叠的 条评论
为什么被折叠?



