这不是教程,这是个人总结,没有阅读体验。
basic
- series可以用list创建,而且series其实就是给ndarray对象加上一层索引。所以在元素替换的时候可以等于list。
- 注意:即使指定了索引,仍然可以用0,1,2,3..作为索引获取数据。但是不规范,应该使用loc和iloc.
- 注意:切片时不是数字的索引包含结尾。
- 指定name便于合并到dataframe
- 查看dtype,修改astype
- values获取到值。
- to_list相对于values/to_numpy的不好之处在于不再能使用numpy的array的方法了.比如s.values.nonzero()查看非零元素。
- s.repeat()和s.reset_index和s.index方便构造新的series。
- 注意:series只有一列,不像dataframe那样,存在set_index,所以直接设置index即可。
- series和dict很像,也有迭代模式。s.items(),s.keys().转为字典用s.to_dict()
- 注意s.count()是不把空值计算在内的,查看元素个数s.size,查看非空元素个数s.count()。
- 在pandas的函数中要特别注意对空值的处理和是否本地化改变数据。比如groupby就会:


- 查看不重复元素及不重复元素个数s.u

本文是对Pandas Series的个人技术总结,涵盖了Series的基本创建、数据分析操作、组合更新、索引操作、缺失值处理以及字符串处理等内容。讨论了如series与ndarray的关系、索引的使用、数据类型转换、缺失值处理、排序、分箱技术以及时间序列分析等关键知识点。
最低0.47元/天 解锁文章
655

被折叠的 条评论
为什么被折叠?



