#该方法只能用于非数值型属性,如果要判断数值型,可以先暂时转换为str类型
df.describe(include=['O'])

unique为不重复的个数,如有值[‘A’,‘B’,‘A’,‘C’]4个值,其unique=3。
devIp,devName等所有值都是重复的,对分析无用,可以去掉。
df=df.drop(['devIp','devName','devFstType','devSndType','devType'],axis=1)
本文介绍使用Pandas库分析数据框(df)中非数值型属性的方法,通过df.describe(include=['O'])展示属性的描述性统计,如不重复值数量(unique),并讨论如何基于此信息筛选去除对分析无益的重复属性。
#该方法只能用于非数值型属性,如果要判断数值型,可以先暂时转换为str类型
df.describe(include=['O'])

unique为不重复的个数,如有值[‘A’,‘B’,‘A’,‘C’]4个值,其unique=3。
devIp,devName等所有值都是重复的,对分析无用,可以去掉。
df=df.drop(['devIp','devName','devFstType','devSndType','devType'],axis=1)
4563

被折叠的 条评论
为什么被折叠?