Pandas DataFrame常用操作

最新推荐文章于 2025-06-12 11:37:08 发布

qq_29750461

最新推荐文章于 2025-06-12 11:37:08 发布

阅读量5k

点赞数 1

分类专栏：机器学习 Python

Python 同时被 2 个专栏收录

93 篇文章

订阅专栏

64 篇文章

订阅专栏

本文介绍了使用 Pandas 进行数据处理的各种实用方法，包括数据读取、选择、聚合、排序、填充缺失值等关键操作。

DataFrame.median() 取中位数
DataFrame.loc[行标签，列标签] 选取数据，第一个值为行标签，第二值为列标签
DataFrame.iloc[行位置，列位置]
pandas.read_csv()
DataFrame.to_csv()
DataFrame.head()
DataFrame.tail()
DataFrame.info()
DataFrame.describe() 对各列的进行描述，如总数，平均值，标准差，最大最小值等。
pandas.cut()
pandas.qcut() 基于分位数的离散化函数。基于秩或基于样本分位数将变量离散化为等大小桶。
pandas.Index.delete() 返回一个新的，删除掉指定位置的index
DataFrame.groupby()
mean()
sort_values() 排序操作
drop()
DataFrame.mode() 众数，返回频数最高的那（几）个
DataFrame.dropna() 丢弃nan相应的行（看参数）
DataFrame.fillna() 用指定值填充nan值
DataFrame.std() 返回样本的标准差
pandas.isnull() 检测缺失值
DataFrame.isnull() 返回同样长度的object，值为boolean，类似还有notnull()
DataFrame.sum() 返回所请求axis对应值的总和
pandas.date_range() 返回一个时间索引
DataFrame.apply() 沿相应轴应用函数
Series.value_counts() 返回不同数据的计数值
DataFrame.aggregate()
DataFrame.max() 返回最大值
DataFrame.reset_index() 重新设置index，参数drop = True时会丢弃原来的索引，设置新的从0开始的索引。常与groupby()一起用
numpy.zeros()
numpy.unique() 返回数组里唯一的值组成的数组

seaborn

color_palette() 创建调色板

axis

http://www.jianshu.com/p/9aa448ea397c
axis=0代表往跨行（down)，而axis=1代表跨列（across)，作为方法动作的副词

使用0值表示沿着每一列或行标签\索引值向下执行方法
使用1值表示沿着每一行或者列标签模向执行对应的方法

Python round() 函数返回浮点数x的四舍五入值
round( x [, n] )
x – 浮点数。
n – 精确度。

type();

confidence score

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。