《利用python进行数据分析.第三版》 第七章 数据清洗和准备语法规则

    
    import pandas as pd
    data1=pd.DataFrame({"k1":["one",'two']*3+["two"],"k2":[1,1,2,3,3,4,4]})
    # print(data1)
    
    data2=data1.duplicated()
    print(data1)
    print(data2)
    
    data3=data1.drop_duplicates()
    print(data3)
    
    data1["k3"]=range(7)
    data4=data1.drop_duplicates(["k1"])
    print(data4)
    
    data5=data1.drop_duplicates(["k1","k2"],keep="last")
    print(data5)
    
    
    answer:
    data1
        k1  k2
    0  one   1
    1  two   1
    2  one   2
    3  two   3
    4  one   3
    5  two   4
    6  two   4
    data2
    0    False
    1    False
    2    False
    3    False
    4    False
    5    False
    6     True
    dtype: bool
    data3
        k1  k2
    0  one   1
    1  two   1
    2  one   2
    3  two   3
    4  one   3
    5  two   4
    data4
        k1  k2  k3
    0  one   1   0
    1  two   1   1
    data5
        k1  k2  k3
    0  one   1   0
    1  two   1   1
    2  one   2   2
    3  two   3   3
    4  one   3   4
    6  two   4   6
[/code]

利用函数或映射进行数据转换


![在这里插入图片描述](https://img-blog.csdnimg.cn/20210608151750993.gif)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值