pandas数据去除某些列，合并列，去重，重建索引

Python数据处理实战

最新推荐文章于 2023-10-27 13:15:22 发布

原创最新推荐文章于 2023-10-27 13:15:22 发布 · 6.7k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #数据抽取

ML 专栏收录该内容

17 篇文章

订阅专栏

本文介绍了一种使用Python进行数据处理的方法。具体步骤包括选取数据集的特定列、合并关键列、去除重复项并重新设置索引。这些操作对于数据预处理至关重要。

def select_data2collision():
    data1 = data.iloc[:,45:] #取45列以后的数据
    data2 = pd.concat([data["CASEID"],data1], axis=1)  #把caseid的列合并进去
    print(data2.head())
    data3 = data2.drop_duplicates(['CASEID'])   #按照cased去重
    print("################")
    print(data3.head())
    data4 = data3.reset_index(drop=True)  #重建索引
    print(data4.head())