import pandas as pd
import numpy as np
1.duplicated():返回bool类型的Series对象,对比每一行的所有列数据,判断是否有重复行,False代表未重复,True代表重复行

2.drop_duplicates():删除重复行

其中可以传指定列的列名,表示只删除指定列的重复行

本文介绍了Pandas库中处理重复数据的方法,包括如何使用duplicated()函数标识重复行及drop_duplicates()函数删除重复数据。此外,还详细解释了这两个函数的参数设置及其应用场景。
import pandas as pd
import numpy as np
1.duplicated():返回bool类型的Series对象,对比每一行的所有列数据,判断是否有重复行,False代表未重复,True代表重复行

2.drop_duplicates():删除重复行

其中可以传指定列的列名,表示只删除指定列的重复行

811
1万+

被折叠的 条评论
为什么被折叠?