系列文章目录:
python数据分析(二)——DataFrame
python数据分析(三)——pandas缺失值处理
series和读取外部数据
一、为什么要学习pandas?
numpy已经能够帮助我们处理数据,能够结合matplotlib解决数据分析的问题,那么pandas学习目的在哪里?
numpy能够帮我们处理数值型数据,但是很多时候除了数值之外,还有字符串、时间序列等
比如:通过爬虫获取到存储在数据库的数据
比如:之前YouTube中除了数值还有国家的信息、视频的分类(tag)信息、标题信息等
所以,numpy能够帮我们处理数值,但是pandas除了处理数值之外(基于numpy),还能帮助我们处理其他类型的数据
二、pandas常用数据类型
- Series 一维,带标签数组,标签指的索引
- dataframe二维,Series容器
1. Series创建
1.1 通过列表创建
代码如下(示例):
In [22]:import pandas as pd
In [23]:pd.Series([1,2,31,12,3,4])
Out[23]:
0 1
1 2
2 31
3 12
4 3
5 4
dtype: int64
In [24]:t = pd.Series([1,2,31,12,3,4])
In [25]:type(t)
Out[25]: pandas.core.series.Series
In [26]:t
Out[26]:
0 1
1 2
2 31