数据的选择(简略版)[2020年3月]
1 Series AND Dataframe
series,只是一个一维数据结构,它由index和value组成。
dataframe,是一个二维结构,除了拥有index和value之 外,还拥有column。数值提取的方法并不唯一,形式也并不固定,这里列出的也并非全部,有兴趣可以继续探索。
2 取值
import numpy as np
import pandas as pd
#假设某天的温度,湿度,降雨量
test = np.arange(1,4)
#创建Series对像
T = pd.Series(test)
#创建DataFrame对象
D = pd.DataFrame((test,test,test),columns=['温度','湿度','降水量'])
Series
| 名称 | 示例 |
|---|---|
| 取单个值 | T[1],取索引为1的值 |
| 取多个值 | T[1:4],取索引1到索引3的数 |
| 取不连续的多个 | T[1:5:2],取索引1到4的数,间隔2 |
| 布尔 | T[T>4], 取T中大于4的数 |
DataFrame
| 名称 | 示例 |
|---|---|
| 取单个值 | 未写 |
| 取单列 | D.温度\D[‘温度’]\D.iloc[:,1]\D.loc[:,‘温度’],不连续的不在赘述,以上。 |
| 取多列 | D[[‘温度’,‘降水量’]].iloc[:,1:3:1]\D.loc[:,[‘温度’,‘湿度’]] |
| 取单行 | D[:1]\D.iloc[0,:]\D.iloc[[1]]\D.loc[[1]]\D.loc[0,:] |
| 取多行 | D[0:2]\D.iloc[0:2,:]\D.loc[0:2,:] |
| 取单行多列/取多行单列 | 都是在前面的基础上进行变化,这里大家自己试试比较好。 |
| 布尔形式 | 布尔形式的取值方式灵活多变,这里就不再举例,原理上来讲,就是通过需求限制行列和值,获取想要的数据。 |
iloc和loc
| 名称 | 注释 |
|---|---|
| iloc | loc函数:通过行索引 “Index” 中的具体值来取行数据(如取"Index"为"1"的行),由于创建的时候没有指定索引,所以这里默认的索引是和行号一致的。 |
| iloc | iloc函数:通过行号来取行数据(如取第二行的数据) |
本文介绍了使用Python的Pandas库进行数据处理的基本方法,包括Series和DataFrame的创建、数值提取及布尔条件筛选等操作,适合初学者快速掌握Pandas的核心功能。
855

被折叠的 条评论
为什么被折叠?



