14、数据处理与分析:从文件读取到数据框整理

数据处理与分析:从文件读取到数据框整理

1. 使用命令行工具和数据加载的场景

在数据处理过程中,使用命令行工具(CLI)有多种好处:
- 文档记录 :当需要记录操作过程时,CLI 工具能很好地满足需求。
- 减少错误 :有助于减少排版等简单但可能有害的错误。
- 可重复性 :方便未来重复相同操作或与他人分享操作流程。
- 处理大量数据 :在处理大量重复操作、大文件或需要快速执行任务时,CLI 工具能发挥重要作用。

将数据加载到数据框后,下一步是确定表格的形状和粒度。以餐厅相关文件为例,加载数据框并查看形状的代码如下:

import pandas as pd
bus = pd.read_csv('data/businesses.csv', encoding='ISO-8859-1')
insp = pd.read_csv("data/inspections.csv")
viol = pd.read_csv("data/violations.csv")
print(" Businesses:", bus.shape, "\t Inspections:", insp.shape, 
     "\t Violations:", viol.shape)

结果显示:
| 表格 | 形状 |
| ---- | ---- |
| Businesses | (6406, 9) |

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值