pandas 查看属性列的重复特性，

最新推荐文章于 2023-05-02 22:25:40 发布

原创最新推荐文章于 2023-05-02 22:25:40 发布 · 1.7k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #重复值

Code经验积累专栏收录该内容

4 篇文章

订阅专栏

本文介绍使用Pandas库分析数据框(df)中非数值型属性的方法，通过df.describe(include=['O'])展示属性的描述性统计，如不重复值数量(unique)，并讨论如何基于此信息筛选去除对分析无益的重复属性。

#该方法只能用于非数值型属性，如果要判断数值型，可以先暂时转换为str类型
df.describe(include=['O'])

在这里插入图片描述
unique为不重复的个数，如有值[‘A’,‘B’,‘A’,‘C’]4个值，其unique=3。
devIp，devName等所有值都是重复的，对分析无用，可以去掉。

df=df.drop(['devIp','devName','devFstType','devSndType','devType'],axis=1)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

方不正圆

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【数据库】Navicat Premium 安装教程

ltfcr_517408的博客

06-21

7957

解压【Crack】前：必须要先关闭“所有杀毒软件(部分电脑自带的“McAfee”也要关闭）、防火墙、Windows Defender”，否则可能会被杀毒软件误杀清除程序或致无法正常运行。

pandas读取EXCEL列名重复问题解决——pandas设置多行为列名（多层列名）

whitedrogen的博客

02-24

5047

在python中使用pandas读取Excel数据，重复数据被区分了，如何做到重复数据不被区分？核心思路：header= int list

参与评论您还未登录，请先登录后发表或查看评论

[Pandas] 查看DataFrame的常用属性

Hudas的博客

05-02

7351

本文主要讲解使用Pandas的常用属性查看DataFrame数据框的基本信息

2.Pandas预览数据

weixin_42167712的博客

08-25

1598

目录1.设置Pandas显示参数2.浏览头5行，后5行数据3.检查数据是否存在缺失值3.1 普通检查3.2 复杂检查（能显示缺失百分比）3.3最终检查4. 了解数据的属性名，数据量，数据类型(data_type)5.了解数据的均值、方差、最大最小值...6.了解数据的形状（几行几列）7.获取属性名/列名7.1返回index对象7.2返回array对象7.3变成列表list格式8. 查看featur...

Pandas中常用属性，查看概览信息

MyNotes

03-14

7172

DataFrame的基础属性 df.shape ——行数列数 df.dtypes——列数据类型 df.ndim ——数据维度 df.index——行索引 df.columns——列索引 df.values——对象值，二维ndarray数组 DataFrame整体情况 df.head(10)——显示前10行，默认是5行 df.tail()——显示末尾几行，默认是5 df.info()——相关系...

pandas查看属性和数据

m0_63808770的博客

07-13

4566

pandas数据访问,修改,以及其他操作

精选资源

Pandas综合练习题一

01-04

在这个“Pandas综合练习题一”中，我们将深入探讨四个关键知识点：查看数据表基本信息、处理重复数据、处理异常值以及处理缺失值。每个部分都至关重要，因为它们直接影响到数据的准确性和分析结果的有效性。首先，...

python pandas 读取excel 去重某一列_Python中Pandas读取修改excel操作攻略（代码示例）...

weixin_39928993的博客

12-08

3547

本篇文章给大家带来的内容是关于Python中Pandas读取修改excel操作攻略(代码示例)，有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。环境:python 3.6.8以某米赛尔号举个例子吧:>>> pd.read_excel('1.xlsx', sheet_name='Sheet2')名字等级属性1 属性2 天赋0 四九幻曦 100 自然...

pandas中调整列的顺序

热门推荐

opp003的博客

02-15

7万+

看到很多人查这个问题，刚好这两天在项目上也用到这一点。要查看各列的数据类型，因为数据处理时，首先就是要高清手里的数据都是什么类型的，尤其要关注字符型，因为很多算法都是不支持字符类型的。当数据维度和数据量都很少的时候，可以很直观的看出来，但是数据量一大，很难肉眼观测，而且很多时候是看不出隐藏的数据问题的。所以要用代码，其实代码很简单。一、读取数据 df = pd.read_csv('da...

Pandas统计重复的列里面的值

hguo11的博客

09-09

1万+

pandas 代码如下: import pandas as pd import numpy as np salaries = pd.DataFrame({ 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'], 'Year': [2016, 2016, 2016, 2016, 20...

pandas将类别属性转化为数值属性的方法

chenpe32cp的博客

07-19

3万+

原文地址离散特征的编码分为两种情况： 1、离散特征的取值之间没有大小的意义，比如color：[red,blue],那么就使用one-hot编码 2、离散特征的取值有大小的意义，比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3} 使用pandas可以很方便的对离散型特征进行one-hot编码import pandas as pd df = pd.Data

python-pandas如何查看某列无重复的值

鱼七

04-08

2万+

python-pandas如何查看某列无重复的值

pandas查看每列数据的类型

qq_44639286的博客

02-27

5579

# 查看每列 cols = df.columns print(cols) for col in cols: print(col+' : '+str(type(df[col][0])))

Pandas数据特征分析

知行流浪

07-17

6978

Pandas数据特征分析数据的排序 .sort_index()方法在指定轴上根据索引进行排序，默认升序。默认0轴升序：.sort_index(axis=0, ascending=True)。 .sort_values()方法在指定轴上根据数值进行排序，默认升序。 Series.sort_values(axis=0, ascending=True) DataFram

【Python 笔记】pandas当列名重复时抽取行列数据

weixin_51244931的博客

01-13

6267

查阅了取行和列的几种常用方式： data['列名']：取单列或多列，不能用连续方式取，也不能用于取行。 data[ i: j ]：用起始行下标(i)和终止行下标(j)取单行或者连续多行，不能用于取列。 data.loc['行名', '列名']：用对象的.loc[]方法实现各种取数据方式。 data.iloc[行下标, 列下标]：用对象的.iloc[]方法实现各种取数据方式。最终根据实际情况选择了如下方法实现功能： import pandas as pd import numpy as np imp