文章目录
概括:Numpy+Scipy+pandas+matplotlib

一.pandas:唯一值、值计数以及成员资格
- unique方法用于获取Series中的唯一值数组(去重数据后的数组)
- value_counts方法用于计算一个Series中各值的出现频率
- isin方法用于判断矢量化集合的成员资格,可用于选取Series中或者DataFrame中列中数据的子集




二.pandas:层次索引
- 在某一个方向拥有多个(两个及两个以上)索引级别
- 通过层次化索引,pandas能够以较低维度形式处理高纬度的数据
- 通过层次化索引,可以按照层次统计数据
- 层次索引包括Series层次索引和DataFrame层次索引



1.两种索引值
代码:
import numpy as np
from pandas import Series, DataFrame
import pandas as pd
data=Series([988.44,55656,6959,56564,1235],
index=[ #设置索引值
['2001','2001','2001','2002','2002'],
[u'苹果',u'香蕉',u'西瓜',u'苹果',u'西瓜']
])
data
结果:
2001 苹果 988.44
香蕉 55656.00
西瓜 6959.00
2002 苹果 56564.00
西瓜 1235.00
dtype: float64
2.层次化索引
代码:
import numpy as np
from pandas import Series,

这篇博客介绍了使用pandas进行数据分析的一些关键操作,包括计算唯一值、值计数、成员资格检查,以及如何进行层次索引和基于层次索引的统计计算。此外,还涵盖了算法运算、数据对齐、函数应用和映射以及重置索引等概念。
最低0.47元/天 解锁文章
:唯一值+值计数+成员资格+层次索引+统计数据&spm=1001.2101.3001.5002&articleId=103846244&d=1&t=3&u=52d0a518bb4b4e0b930b16d6c385cfea)
1万+

被折叠的 条评论
为什么被折叠?



