dataframe是一种表格型的数据存储结构,可以看作是几个serie的集合。dataframe既有行索引,也有列索引。
以下代码环境为google colab/jupyter notebook。
接下来就对dataframe的基本使用进行整理。
dataframe也从属于pandas模块,因此还是老规矩,先import pandas。
import pandas as pd
import numpy as np
1. dataframe的创建
dataframe的创建有很多方法,下面列举了几种主要的创建方法。
a. 通过numpy ndarray创建dataframe
在创建dataframe时,可以自定义行索引index和列索引columns。
arr = np.random.randn(6,4)
index_rows = pd.date_range('today', periods=6)
index_columns = ['A','B','C','D']
dataframe1 =
pd.DataFrame(arr,index=index_rows,columns=index_columns)
dataframe1
运行结果:

b. 通过字典dictionary创建dataframe
data = {
'country': ['China','Japan','France'],
'capital': ['Beijing','Tokyo',

本文介绍了Python Pandas库中的DataFrame数据结构,包括如何创建DataFrame、基本操作如切片、排序、统计属性获取,以及如何备份、读写文件和进行可视化。示例代码展示了使用numpy创建DataFrame、通过字典创建DataFrame、使用head/tail方法、统计数据属性、翻转行列、按列名查询、使用loc定位和操作数据,以及处理未定义值的方法。
最低0.47元/天 解锁文章





