Pandas DataFrame 日常的操作与发现

最新推荐文章于 2025-11-02 00:00:00 发布

原创最新推荐文章于 2025-11-02 00:00:00 发布 · 971 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#python #pandas

python 专栏收录该内容

5 篇文章

订阅专栏

本文介绍了Pandas库中的一些高级操作技巧，包括如何选择数据、与矩阵及数组的转换方法、处理空值的不同策略以及如何进行数据集的合并。

import numpy as npimport pandas as pd

一，选择数据

当使用ix[a,b]精确取元素时，a取df的index值。例子中end_time为df的index

a = df.ix[end_time,0]

但是使用iat[m,n]精确取元素时，第一个arg不能为index,必须为行的行号

二. 与Matrix，数组转换

csv文件的数据是N行一列，将它读取到程序保存为一维数组。

df = pd.read_csv('filename.csv',header = None)
mat = df[0].T.as_matrix()
list_1 = list(mat)

三.空值处理（NaN和None）

df.fillna(0) 
df.fillna({1:0,2:0.5}) #对第一列nan值赋0，第二列赋值0.5
df.fillna(method='ffill') #在列方向上以前一个值作为值赋给NaN
df.fillna(method='bfill',limit=1) #<span lang="zh-CN" style="font-family:宋体">表示用后一个数据代替</span><span lang="en-US" style="font-family:
'MV Boli'">NaN</span>
df.fillna(df.mean()) #<span lang="zh-CN" style="font-family:宋体">表示用平均数或者其他描述性统计量来代替</span><span lang="en-US" style="font-family:'MV Boli'">NaN</span>

四. 合并

横着，并排，以行为单位

result = pd.concat([df1, df4], axis=1)
result = pd.concat([df1, df4], axis=1, join='inner')
result = pd.concat([df1, df4], axis=1, join_axes=[df1.index])