智能铣削正式上线测试,现在要为平台准备测试数据, 我找了些相关的数据,但是因为数据量比较大,手工处理起来相当繁琐和累,所以我打算用Python来批量处理这些数据,下面是我们公司的一些子公司名称,我要做的就是把这些数据整理出来做成excel表单方便系统进行批量导入操作。
思路:首先我们先分析文本内容,每个公司都是以空格隔开的,所以我们先读取这个文本,通过split切割数据,将其存储成数组,这里我只要带括号的公司数据,所以我们先判断下每条数据中是否有该字符串,有的话则写入excel,没有则跳过,最后我们还要提取括号中的地址信息出来,得到如下的结果。
这里我们要用到的模板 ‘xlwt’,它是python写入Excel文件的扩展工具,有网直接pip install xlwt就可以安装,没网自行下载离线包安装,可以去https://pypi.org/下载‘xlwt’模板
读取company.txt文件,使用Python自带的open方法打开,通过read读取文本中的数据,在用split对数据进行分割,这样我们就得到了一组关于公司的数据了。
接下来对数据进行处理,我们先创建一个excel工作簿和表单,Python中创建Excel很简单,直接使用xlwt中的Workbook即可,创建好Excel后因为数据中有部分没有括号的数据,所以这里我们需要对数据进行简单的判断,查找是否含有‘(’和‘)’的数据,将有的数据提取出来并且将括号中的地址也分割出来,这里我用--隔开下,打印我们就得到如下的数据 了。
book = xlwt.Workbook() #创建一个Excel文件
sheet1 = book.add_sheet('company', cell_overwrite_ok=True) #创建一个sheet
title = ['序号','公司名称','公司地址'] #表头数组
接着我们就可以将提取好的数据写入到我们的Excel表中了,因为剔除了不带括号的数据,所以我们在写入的时候就不能在用i来定义行了,这里我定义了一个j=0,每次执行之后自增1,这样我们就可以完美的把需要的数据提取到一起了。
写入Excel表中,最后别忘记保存Excel表单哦,这里为了测试功能暂时注释了保存功能,后面可以在完善一下,判断下文件是否存在,有的话就删除在保存,以下是简单的功能代码。
import xlwt
f=open(r'C:\Users\C18110034L\Desktop\company.txt','r')
content=f.read()
company=content.split(' ')#分割数据
# print(company)
book = xlwt.Workbook() #创建一个Excel文件
sheet1 = book.add_sheet('company', cell_overwrite_ok=True) #创建一个sheet
title = ['序号','公司名称','公司地址']
j=0
for i in range(len(title)):
sheet1.write(0,i,title[i])
for i in range(len(company)):
if company[i].find('(') != -1 and company[i].find(')') != -1 :
start = company[i].index('(')
end = company[i].index(')')
addr = company[i][start+1:end]
print(company[i],' -- '+addr)
sheet1.write(j+1,0,j+1)
sheet1.write(j+1,1,company[i])
sheet1.write(j+1,2,addr)
j+=1
# book.save(r'C:\Users\C18110034L\Desktop\test'+'.xls')