Pandas如何基于某一列的数据对其它列数据进行操作(三种方法)

我们就简单举一个例子

把star_rating为3到4中的positive减去0.25

把star_rating小于3的positive减去0.3

star_ratingpositive
050.98072
110.737101
250.945672
320.729632
450.99853
530.408589
610.650988
710.666691
850.899953
940.895248
1040.609864
1130.614354
1240.892443
1330.648455
1440.880974
1550.998756
1630.046396
1740.882441
1810.509702
1950.959157
2010.640282

这里提供多种方法有麻烦有简单:

法一(利用切片):

dff.loc[(3 <= dff["star_rating"])&(dff["star_rating"] <= 4),"positive"] = dff.loc[(3 <= dff["star_rating"])&(dff["star_rating"] <= 4),"positive"].apply(lambda x:np.abs(x-0.25))
dff.loc[(0 <= dff["star_rating"])&(dff["star_rating"] < 3),"positive"] = dff.loc[(0 <= dff["star_rating"])&(dff["star_rating"] <  3),"positive"].apply(lambda x:np.abs(x-0.3))

法二(利用apply + lambda):

def to_cal(x,y):
    if 3 <=x <=4:
        y -= 0.25 
    elif 1 <= x < 3:
        y -= 0.2
    return y 
dff.apply(lambda row:to_cal(row["star_rating"],row["positive"]),axis = 1)

法三 (切片 + apply)

def fun(a):
    if a['star_rating'] <= 3:
        a.loc["positive"]  = a.loc["positive"] - 0.3
    elif a['star_rating'] >3 and a['star_rating'] <= 4:
        a.loc['positive'] = a.loc['positive'] - 0.25
    return a

data = dff.loc[:].apply(fun,axis = 1)

以上提供了3种解决思路,如果在看的大佬们还有更好的思路欢迎提出来哦

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值