前置知识 - Series索引,NumPy数组索引,Python列表索引
相关知识 - 索引、切边、掩码、花哨的索引,组合索引
1. 将DataFrame看作字典
把 DataFrame 当作一个由若干 Series 对象构成的字典
#DataFrames数据选择示例
import pandas as pd
#把 DataFrame 当作一个由若干 Series 对象构成的字典
#创建dataframe
s1 = pd.Series({"a":"chinese","b":"math"})
s2 = pd.Series({"a":87,"b":98})
df = pd.DataFrame({"subject": s1, "grade":s2})
print("Out1:\n", df)
print("Out2:\n", df["grade"])
#也可以用属性形式(attribute-style)选择纯字符串列名的数据
print("Out3:\n", df.subject)
#如果列名不是纯字符串,或者列名与 DataFrame 的方法同名,那么就不能用属性索引。
#还应该避免对用属性形式选择的列直接赋值(即可以用 data['pop'] = z,但不要用data.pop = z)
Out1:
subject grade
a chinese 87
b math 98
Out2:
a 87
b 98
Name: grade, dtype: int64
Out3:
a chinese
b math
Name: subject, dtype: object
2. 将DataFrame看作二维数组
2.1 Pandas 索引器 loc (显式索引)
df.loc[选择行,选择列],结果包括最后一个索引
#将DataFrame看作二维数组
print("Out1:\n",df.loc["a","subject"

本文介绍了Python中DataFrame的数据索引,包括将DataFrame视为字典和二维数组的视角。重点讲解了Pandas的loc(显式索引)、iloc(隐式索引)以及不推荐的ix(混合索引)的用法,强调了使用loc和iloc的可维护性和可读性。
最低0.47元/天 解锁文章
2672

被折叠的 条评论
为什么被折叠?



