# 首先是安装pandas库 # pip install pandas matplotlib 这个是在终端进行操作 import pandas as pd # 引入pandas库,按照惯例起别名pd # 读取数据 df1 = pd.read_csv("E:/Test/BJ_Air.csv.", header = 0) # print(df1) df2 = pd.read_excel('E:/Test/three_China.xlsx', header = 0) # print(df2) # 查看数据 df1.head() df1.tail() df1.sample(5) print(df1.head()) print(df1.tail()) print(df1.sample(5)) # 验证数据 df1.shape # 查看行数和列数 print(df1.shape) df1.info() # 查看索引、数据类型和内存信息 print(df1.info()) df1.describe() print(df1.describe()) df1.dtypes # 查看各字段类型 print(df1.dtypes) df1.axes # 显示行数和列数 print(df1.axes) df1.columns # 列名 print(df1.columns) # 建立索引 df1.set_index('date', inplace = True) print(df1.head()) # 数据选取 df1['Co'] # 查看指定列 print(df1['Co']) # 选择多列 df1[['Co','No2']] # 只看这两列,注意括号 df1.loc[:,['Co','No2']] print(df1[['Co','No2']]) print(df1.loc[:,['Co','No2']]) # 选择行 # 用指定索引选取 df1[df1.index == 'date'] # 引号里需要指定姓名 print(df1[df1.index == 'date']) df1[0:3] # 取前三行 print(df1[0:3]) df1[0:10:2] # 在前十个中每两个取一个 pri
深入浅出pandas——第一部分:pandas入门
于 2023-07-03 14:42:33 首次发布
该文演示了如何使用Python的Pandas库进行数据操作,包括安装Pandas,读取CSV和Excel文件,查看数据,设置索引,选择和过滤数据,排序以及进行分组聚合等操作。

最低0.47元/天 解锁文章
924

被折叠的 条评论
为什么被折叠?



