五、数据
1.便捷数据获取
matplotlib.finance、datetime等模块
自然语言工具包NLTK
古滕堡语料库
布朗语料库
路透社语料库
网络和聊天文本
…
2.数据准备
数据整理:
quotes数据加属性名
datetime做格式转换
3.数据显示
显示方式:
djidf.index 显示索引
djidf.columns 显示列名
djidf.values 显示数据的值
djidf.dexcribe 显示数据描述
djidf.head(n)
djidf.tail(n)
4.数据选择
选择方式:
l 行、列 标签label(loc)
djidf.loc[起始索引:结束索引,[列名]]
l 单个值 at
djidf.at[索引值,列名]
也可以djidf.loc[索引值,列名]
l 行、列和区域 用iloc(位置)
djidf.iloc[起始位置:结束位置,列位置]
l 取某个值 iat
djidf.iat[起始位置:结束位置,列位置]
l 条件筛选
quotesdf[筛选条件]
5.简单统计与处理
6.分组Grouping
groupby(所基于的分组字段)
7.Merge
l append
p.append(q) 把q加到p后
l concat
pd.concat(pieces) 将碎片连接起来
l join
pd.merge(表1,表2,on=所基于的字段).drop(要去掉的字段)