[Python数据处理] 怎样用Python预处理csv文档提取数据

本文介绍了如何使用Python的pandas库读取GBK和UTF-8编码的CSV文件,展示从文件中提取数据的方法,并给出了完整的代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

[问题背景]

处理以下文本文件:

grade_gbk.csv  (GBK编码格式)

grade_uft-8.csv (UTF-8编码格式)

每个文件内容相同,共三条数据,每条数据的第一项是姓名,第二项是语文,第三项是数学,第四项是英语

首先打开Excel,输入以下内容:

姓名 语文 数学 英语
张三 128 136 112
李四 99 106 73
王五 102 148 88

然后另存为两次,第一次的文件名为'grade_gbk.csv',保存类型为'CSV (逗号分隔)(*.csv)';第二次的文件名为'grade_utf-8.csv',保存类型为'CSV UTF-8 (逗号分隔)(*.csv)',这样就得到了两种不同编码格式的.csv文件,实际应用中两种编码都可能遇到,所以下面的演示对两种编码的.csv文件的读取都作一个简单的介绍。

[问题分析]

在.csv文件所在目录下新建.py文件,注意.py文件名可以自取,但不能是csv.py,否则代码中调用csv时会调到自身报错AttributeError: module 'csv' has no attribute 'excel'。(关于这个错误的解决,参考了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值