1、replace(替换)
df["编号"].replace(r'BA.$',value='NEW',regex=True,inplace=True)
2、rank(数据排名)
df["排名"]=df.rank(method="dense").astype("int")
3、clip(对于超过或低于某些数值进行截断)
df["迟到天数"]=df["迟到天数"].cllip(0,31)
4、unique(唯一值)和nunique(非唯一值)
5、apply和applymap
#apply将一个自定义函数作用于行或列;applymap函数将自定义函数作用于所有元素
df["数量"].apply(lambda x:x+1)
6、文本操作
示例:df.insert(2,"姓名",df["姓"].str.cat(df["名"],sep=""))
7、行/列索引
df.reset_index(drop=True)
df.rename(columns={"mark":"sell"},inplace=True)
df.drop(columns=["mark"])
8、melt(将宽表转长表)
df.melt(id_vars="姓名", var_name="科目", value_name="成绩")
9、isin(判断该列元素是否在列表中)
name_list = ["张三", "李四"]
df[df["姓名"].isin(name_list)]
10、数据统计运算
df["累计销量"] = df["销量"].cumsum()