
pandas
chou_shun
此人很懒,嘛也没有写
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pandas:重命名index、columns,分箱
上文说到了怎么对DataFrame中的值进行转换,那么如果想对索引进行转换,应该怎么做呢? 重命名轴索引 第一种方法:暴力地重定义 直接对index,columns属性进行重赋值即可: import numpy as np import pandas as pd a = pd.DataFrame(np.arange(12).reshape((3, 4)), in...原创 2020-03-19 10:21:38 · 3404 阅读 · 0 评论 -
pandas数据清洗:删除重复值、利用映射进行逐元素转换、值的替代
之前那篇博客讲了讲怎么处理缺失值,这一篇记录一下怎么对数据进行过滤和清洗。 删除重复值 删除重复行一般有三种方法: duplicated方法:返回一个布尔值Series。如果该行是重复行(与之前出现的行相同),则在Series中对应的值为True,反之为False drop_duplicates方法:返回duplicated方法中返回数组中为False的部分(即打印原对象中去掉重复行后的部分)。...原创 2020-03-18 10:44:47 · 494 阅读 · 0 评论 -
pandas初探:DataFrame生成,索引与修改
DataFrame在形式上可以看作是Series的升级版,它可以有多个列,并且每一列都有列标签。 呐,DataFrame是长这个样子的: 构建DataFrame 一般有两种方式构建DataFrame 1.利用包含等长度列表或者数组 import pandas as pd data = {'state': ['Beijing', 'Beijing', 'Beijing', 'Shanghai', ...原创 2020-03-13 10:57:48 · 1398 阅读 · 0 评论 -
pandas初探:Series生成与索引
Series Series是一种一维的数组型对象,它包括一个值序列,和它们的索引。 直观的来说,它更像一个字典。因为它的形式为索引:值 生成Series一般有两种方法,通过列表和通过字典 1.列表生成Series import pandas as pd from pandas import Series, DataFrame obj = pd.Series([1, 2, 4]) print(ob...原创 2020-03-12 12:04:21 · 1136 阅读 · 0 评论