LeetCode *80. Remove Duplicates from Sorted Array II (Python Solution)

本文提供了一种在O(1)额外空间复杂度下,对已排序数组进行去重,使每个元素最多出现两次的Python解决方案。通过双指针技巧,有效地实现了就地修改输入数组。

题目描述

Given a sorted array nums, remove the duplicates in-place such that duplicates appeared at most twice and return the new length.

Do not allocate extra space for another array, you must do this by modifying the input array in-place with O(1) extra memory.

给定排序的数组nums,就地删除重复项,使重复项最多出现两次并返回新的长度。

不要为另一个数组分配额外的空间,必须通过使用O(1)额外内存修改输入数组来实现此目的。

Example 1:

Given nums = [1,1,1,2,2,3],

Your function should return 
length = 5, with the first five 
elements of nums being 1, 1, 2, 2 
and 3 respectively.

It doesn't matter what you
leave beyond the returned length.

Example 2:

Given nums = [0,0,1,1,1,1,2,3,3],

Your function should return l
ength = 7, with the first seven elements
of nums being modified to 
0, 0, 1, 1, 2, 3 and 3 respectively.

It doesn't matter what values are 
set beyond the returned length.

Python Solution

分析: 这道题目是在 LeetCode 27 LeetCode 26 的基础上改动的一道题,将出现一次改为出现两次,只需要在原来的基础上加一个 count 用来计数即可。需要注意的是题目只允许 O(1) 的空间复杂度,即必须在原来的 list 上进行改动。

这里采取的思想有点像双指针,一开始都是指向 nums[0] 这个元素,然后一个指针作为改变的基准值 idx ,另一个指针 i 去从 1 开始走 for 循环(因为是排序列表,所以第一个值一定是最小的不会改变)。

如果值发生了改变不等于 nums[idx] ,就先将 idx + 1,再将 nums[i] 赋给 nums[idx] 并且将 count 清零 。

如果没有改变则判断这个值出现次数是不是达到了两次,如果没到则交换移动到 nums[idx] ,如果到了两次则忽略不管。

这样实现的效果其实就是 nums[idx] 一直是现在见到的最小值,一旦 nums[i] 和这个值不一样,即有了更大的值。

代码如下:

class Solution:
    def removeDuplicates(self, nums: List[int]) -> int:
        if not nums:
            return None
        idx, count = 0, 0
        for i in range(1, len(nums)):
            if nums[i] != nums[idx]:
                idx += 1
                nums[idx] = nums[i]
                count = 0
            else:
                if count < 1:
                    idx += 1
                    nums[idx] = nums[i]
                    count += 1
        return idx + 1
复杂度分析:

时间复杂度:O(n) ,for 循环从头到尾遍历一次,赋值的时间复杂度为 O(1) 所以没有影响。
空间复杂度:O(1) ,只是改变数组列表,并没有新建操作。

Nano-ESG数据资源库的构建基于2023年初至2024年秋季期间采集的逾84万条新闻文本,从中系统提炼出企业环境、社会及治理维度的信息。其构建流程首先依据特定术语在德语与英语新闻平台上检索,初步锁定与德国DAX 40成分股企业相关联的报道。随后借助嵌入技术对文本段落执行去重操作,以降低内容冗余。继而采用GLiNER这一跨语言零样本实体识别系统,排除与目标企业无关的文档。在此基础上,通过GPT-3.5与GPT-4o等大规模语言模型对文本进行双重筛选:一方面判定其与ESG议题的相关性,另一方面生成简明的内容概要。最终环节由GPT-4o模型完成,它对每篇文献进行ESG情感倾向(正面、中性或负面)的判定,并标注所涉及的ESG具体维度,从而形成具备时序特征的ESG情感与维度标注数据集。 该数据集适用于多类企业可持续性研究,例如ESG情感趋势分析、ESG维度细分类别研究,以及企业可持续性事件的时序演变追踪。研究者可利用数据集内提供的新闻摘要、情感标签与维度分类,深入考察企业在不同时期的环境、社会及治理表现。此外,借助Bertopic等主题建模方法,能够从数据中识别出与企业相关的核心ESG议题,并观察这些议题随时间的演进轨迹。该资源以其开放获取特性与连续的时间覆盖,为探究企业可持续性表现的动态变化提供了系统化的数据基础。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值