第十章 pandas官方文档0.22中文教程---Tutorials(有关cookbook),个人渣翻译

这篇博客提供了pandas的简单教程,包括从CSV读取数据,修复编码错误,处理日期,选择和过滤数据。通过实例展示了如何使用read_csv、处理日期列、选择DataFrame的列以及如何进行数据过滤,特别提到了在纽约311服务请求数据集中筛选噪音投诉的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这是一个包涵许多pandas教程的指南,主要面向新用户。
#####内部指南
看10分钟入门pandas*(10 Minutes to pandas)
更复杂的使用方法参看cookbook
这里写图片描述
#####pandas cookbook
这本cookbook的目标是给你一些具体的例子,让你从pandas开始。这些都是真实数据的例子,以及它所包含的所有错误和古怪。
这里是v0.1版本的链接。对于最新的目录,请参阅pandas-cookbook GitHub存储库。要运行本教程中的示例,您需要克隆GitHub存储库并运行IPython Notebook。看看如何使用这本cookbook。
(先去github下载数据,否则下面的章节没办法完成)
这里写图片描述
######快速的浏览一下IPython Notebook
教你一些IPython的简单用法

######chapter 1. 把你的数据由pandas读取听起来是最简单的事情。即使编码是错误的

从csv文件中读取一个数据
您可以使用read_csv函数从CSV文件中读取数据。默认情况下,它假定字段是逗号分隔的。
我们将从蒙特利尔看一些骑自行车的数据。这里是原始页面(在法语中),但它已经包含在这个存储库中。我们使用的是2012年的数据。

import pandas as pd
pd.set_option('display.mpl_style', 'default') # Make the graphs a bit prettier
figsize(15, 5)

个人执行:运行display.mpl_style出错
这里写图片描述

broken_df = pd.read_csv('../data/bikes.csv')
# Look at the first 3 rows
broken_df[:3]

(因为自己的ipython工作路径,和下载的bikes.csv路径不一致,写代码的时候要注意)
个人执行:直接报错,看不了什么前3行
这里写图片描述
你可以看到这完全损坏了。read_csv拥有一堆选项能够让我们修复它,在这里我们:

将列分隔符改成;
将编码改为latin1(默认为utf-8)
解析Date列中的日期
告诉它我们的日期将日放在前面,而不是月
将索引设置为Date

fixed_df = pd.read_csv('../data/
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值