Python玩转数据分析学习笔记-05数据

本文介绍如何使用matplotlib.finance、datetime等模块进行数据获取,并利用自然语言工具包NLTK及各种语料库处理文本数据。文章还详细讲解了数据整理、显示、选择的方法,包括不同属性的设置和数据统计处理技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

五、数据

1.便捷数据获取

matplotlib.finance、datetime等模块

自然语言工具包NLTK

    古滕堡语料库

    布朗语料库

    路透社语料库

    网络和聊天文本

    …

 

2.数据准备

数据整理:

quotes数据加属性名

datetime做格式转换

 

3.数据显示

显示方式:

djidf.index                 显示索引

djidf.columns            显示列名

djidf.values               显示数据的值

djidf.dexcribe           显示数据描述

djidf.head(n)

djidf.tail(n)

 

4.数据选择

选择方式:

l  行、列             标签label(loc)

djidf.loc[起始索引:结束索引,[列名]]

l  单个值             at

djidf.at[索引值,列名]

也可以djidf.loc[索引值,列名]

l  行、列和区域        用iloc(位置)

djidf.iloc[起始位置:结束位置,列位置]

l  取某个值                 iat

djidf.iat[起始位置:结束位置,列位置]

l  条件筛选

quotesdf[筛选条件]

 

 

5.简单统计与处理

 

6.分组Grouping

groupby(所基于的分组字段)

 

7.Merge

l  append

p.append(q)                      q加到p

l  concat

pd.concat(pieces)             将碎片连接起来

l  join

pd.merge(1,2,on=所基于的字段).drop(要去掉的字段)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值