-
多条件取子表
用&直接在df[] 中进行操作
rules[ (rules[‘lift’] >= 6) &
(rules[‘confidence’] >= 0.8) ] -
删除此条件内容 ~
df = df[~df[‘InvoiceNo’].str.contains(‘C’)] -
直接去除空格
df[‘Description’] = df[‘Description’].str.strip() -
复合操作!简洁太多了!!!省去了很多new 新variable对其赋值的繁琐
basket = (df[df[‘Country’] ==“France”]
.groupby([‘InvoiceNo’, ‘Description’])[‘Quantity’]
.sum().unstack().reset_index().fillna(0)
.set_index(‘InvoiceNo’))