前言
之前在学爬虫的时候,有学到用Python将爬取的数据保存在excel中,不过只是用xlwt库
进行写操作。
昨天,一个应用数学专业
同学来找我,说晚上要交期中作业,让我帮他处理点数据,数据是保存在excel文件
,本着助人为乐的精神,帮他写了个py脚本,随便学到了如何用xlwt
(实现写操作)和xlrd
(实现读操作)两个第三方库处理excel文件。
第三方库
其实,不止有xlwt和xlrd这两个库能够处理excel数据,只不过是我用过xlwt这个库,比较熟悉,所以就接着用了。
各个库对比:
xls文件和xlsx文件
从图可以看出,我用到的库只能处理xls文件,而不能处理xlsx文件,这两种文件格式有何差别?
文件核心结构不同:
xls核心结构是复合文档类型的;
xlsx 的核心结构是 XML 类型的结构,并且基于XML进行压缩(占用空间更小),所以也可以看做zip文件,将一个“.xlsx”文件的后缀改为ZIP后,用解压软件解压,可以看到里面有一个xml文件和文件的主要内容。