Series
序列,一维数组
import pandas as pd
import numpy as np
a = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}
s1 = pd.Series(a)
print(s1)
DataFrame
pd.DataFrame( data, index, columns, dtype, copy) #语法
data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'],
'year': [2000, 2001, 2002, 2001, 2002, 2003],'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
df1 = pd.DataFrame(data)
查看DataFrame数据的每列的名称
- 切片查看
[column for column in df]
- df.columns
得到的是array 所以 tolist 变成list
3. list 关键字 暂时没查出来为啥这这个方法可以???
- df.keys()
函数返回 Pandas 对象的“信息轴”。如果 Pandas 对象是系列,则它返回索引。如果pandas对象是dataframe,则它返回列。如果 Pandas 对象是面板,则它返回major_axis。
取值
loc:通过行、列的名称或标签来索引
iloc:通过行、列的索引位置来寻找数据
删除
获取列的list,先比对长度,然后比对元素(这里已经知道多了,就没比较长度)
1.drop 方法从行或列中删除/删除指定的 labels。
labels 可以是单个标签或要删除的类似列表的索引或列标签。
axis 指定是从索引/行(0 或 index)还是从列(1 或 columns)删除标签。
DataFrame.drop(self,labels = None,axis = 0,index = None,columns = None,level = None,inplace = False,errors ='raise' )
- del df[‘col_name’] 删除名称为 col_name 的 DataFrame 列。
- df.pop(item)
DataFrame pop 方法返回该元素并将其从 DataFrame 中删除。
隐藏某一列
df1.style.hide_columns(['PassengerId','Name','Age','Ticket'])
筛选
某个值
data = df[(df['列名1']== ‘列值1')]
# 多条件匹配时
data_many=df[(df['列名1']== ‘列值1')&(df['列名2']==‘列值2')]
# 多值匹配时
data_many=df[df['列名1'] in [‘值1',‘值2',......]]
#### 1.5.3 任务三:将midage的数据中第100行的"Pclass"和"Sex"的数据显示出来
midage.loc[100,["Pclass","Sex"]]
在这里插入图片描述