原始数据准备
import pandas as pd
df1=pd.DataFrame()
df2=pd.DataFrame()
df1['name']=['a','b','c','d','e','f','g']
df2['name']=['a','b','c','d','e','f']
df1['class']=['1','1','2','2','3','3','2']
df2['grade_state']=['1','1','1','','','3']
df3=df1.merge(df2,how='left') #产生NaN空值
统计不同班级所有成绩等级的个数(使用count,nunique,unique不同结果如图)
结论:count是统计非空数值个数(过滤掉nan,但会统计空字符串’‘)
unique是返回去重后所有元素(包含nan以及空字符串’‘)
nunique是统计去重后元素的个数(过滤掉nan,但会统计空字符串’‘)