day04：初识pandas

最新推荐文章于 2025-07-06 23:48:37 发布

原创最新推荐文章于 2025-07-06 23:48:37 发布 · 110 阅读

0 ·

CC 4.0 BY-SA版权

学习记录专栏收录该内容

10 篇文章

订阅专栏

本文介绍了Pandas中Series和DataFrame的创建方法，包括使用空列表、字典以及数据列表。详细阐述了如何进行索引和切片，如按标签或位置选取数据。此外，还讲解了如何处理缺失数据，如用NaN替换特定值，以及使用dropna和fillna方法。最后，提到了数据排序及DataFrame的缺失数据处理策略。

Series如何创建，如何进行索引和切片

一维，带标签的数组

pd.Series([])
pd.Series({}) #字典的键就是Series的索引
s1[“a”]
s1[["a","c"]]
s1[1]
s2[[1,5,3]]
s2[4:10]

DataFrame如何创建，如何进行索引和切片

二维，Series的容器

pd.DataFrame([[],[],[]]) #接收2维数组
pd.DataFrame({“a”:[1,23],“c”:[2,3]})
pd.DataFrame([{},{},{}])
行索引表明不同行，横向索引，为index，0轴（axis=0）
列索引表明不同列，纵向索引，为columns，1轴（axis=1）
排序方法：对象名/变量名.sort_values(by"某一列",ascending=True/False[管理升降序])
df[:20]["某一列索引名“]取前二十行某一列
loc与iloc分别可以根据标签索引获取和根据位置获取

DataFrame缺失数据处理

0
- 并不是所有的都需要处理
- df[df==0] = np.nan
nan
- pd.isnan ，pd.notnan
- df.dropna(axis=0,how=“any[all]”,inplace=True)[all表示有nan就全删了，all是那一行全为nan才删]
- df.fillna(df.mean())
- df[“A”] = df[“A”].fillna(df[“A”].mean())
- pd.isnull，pd…notnull判断是否有nan
- nan不会参与计算但是0会
- 处理为0的数据：t[t==0]=np.nan