Series如何创建,如何进行索引和切片
一维,带标签的数组
-
pd.Series([])
-
pd.Series({}) #字典的键就是Series的索引
-
s1[“a”]
-
s1[["a","c"]] -
s1[1] -
s2[[1,5,3]] -
s2[4:10]
DataFrame如何创建,如何进行索引和切片
二维,Series的容器
pd.DataFrame([[],[],[]])#接收2维数组- pd.DataFrame({“a”:[1,23],“c”:[2,3]})
- pd.DataFrame([{},{},{}])
- 行索引表明不同行,横向索引,为index,0轴(axis=0)
- 列索引表明不同列,纵向索引,为columns,1轴(axis=1)
- 排序方法:对象名/变量名.sort_values(by"某一列",ascending=True/False[管理升降序])
- df[:20]["某一列索引名“]取前二十行某一列
- loc与iloc分别可以根据标签索引获取和根据位置获取
DataFrame缺失数据处理
- 0
- 并不是所有的都需要处理
- df[df==0] = np.nan
- nan
- pd.isnan ,pd.notnan
- df.dropna(axis=0,how=“any[all]”,inplace=True)[all表示有nan就全删了,all是那一行全为nan才删]
- df.fillna(df.mean())
- df[“A”] = df[“A”].fillna(df[“A”].mean())
- pd.isnull,pd…notnull判断是否有nan
- nan不会参与计算但是0会
- 处理为0的数据:t[t==0]=np.nan
本文介绍了Pandas中Series和DataFrame的创建方法,包括使用空列表、字典以及数据列表。详细阐述了如何进行索引和切片,如按标签或位置选取数据。此外,还讲解了如何处理缺失数据,如用NaN替换特定值,以及使用dropna和fillna方法。最后,提到了数据排序及DataFrame的缺失数据处理策略。
1972

被折叠的 条评论
为什么被折叠?



