pandas为python中用于数据处理相关模块,当然其依赖与一些模块而存在,如使用read_excel读取相应文件时,需要安装相应的xlrd模块,否则将会出现错误提示。
使用方法示例
#!/usr/bin/python
import pandas as pd
#... ...
srdata = pd.read_excel('2017.xls',encoding='gbk')
with open('cvrt.txt','w',encoding='UTF-8') as outfile:
srdata.to_string(outfile)
说明: read_excel为读取excel表格的元素,encoding为编码方式;with open的方式可以打开文件处理,而不需要使用.close()的方式进行关闭,with open可以同时打开多个文件处理,形如 with open(file1name) as f1, open(file2name) as f2: ;而pd提供了多种方法,可以读取各种不同的文件,如常用的read_excel() read_csv() read_json() read_html()等等;
遇到的问题及解法
1、使用read_excel时,提示缺少xlrd模块
使用python -m pip install xlrd 进行安装,通常情况下只有一个版本的python及pip时,可以直接使用pip install 进行安装,而多个python版本时,需要使用python(version) -m pip install xlrd进行安装,才能保证版本的对应关系。
2、csv无法读取的问题
有些csv源文件无法读取,尝试后,发现在pandas模块中read_excel函数可以进行处理。
3、read_csv列数不匹配的冲突
在使用过程中,遇到错误提示: pandas.errors.ParserError: Error tokenizing data. C

这篇博客介绍了如何使用pandas的read_excel和read_csv函数将文件转换为txt文本格式。在操作中,遇到了缺少xlrd模块的问题,通过pip安装解决。此外,还解决了csv文件读取问题和因列数不匹配引发的ParserError,提供了解决方案。
最低0.47元/天 解锁文章
3315

被折叠的 条评论
为什么被折叠?



