-
针对一个excel文件中多个sheet的批处理,excel的选定全部工作表功能可以解决很多问题(如:转置、替换等),但是对于排序确难以实现。因此在这里使用python工具来实现批量排序。
- 最终目的是实现对每个sheet文件排序后,将所有sheet拼接在一个sheet中。
- 最初打算先批量排序,然后在实现拼接。
但是在运行批量排序的代码中发现sheet发生覆盖,虽然网上有避免覆盖的方法,但是不适用于这里。这里先介绍该方法。
https://blog.youkuaiyun.com/qq_39697564/article/details/88640686
# 1. 基本模块的导入
import numpy as np
import pandas as pd
# 2. 创建不同的写入数据
DF_1 = pd.DataFrame(np.random.rand(12).reshape(6,2),columns=list('AB'))
DF_2 = pd.DataFrame(np.random.rand(12).reshape(6,2),columns=list('CD'))+1
DF_3 = pd.DataFrame(np.random.rand(12).reshape(6,2),columns=list('EF'))+2
DF_4 = pd.DataFrame(np.random.rand(12).reshape(6,2),columns=list('GH'))+3
# 3. 数据写出
with pd.ExcelWriter(r'C:\Users\Desktop\ExcelTest\DF_All.xlsx') as writer:
DF_1.to_excel(writer,sheet_name='DF_1')
DF_2.to_excel(writer,sheet_name='DF_2')
DF_3.to_excel(writer,sheet_name='DF_3')
DF_4.to_excel(writer,sheet_name='DF_4')
writer.save()
writer.close()
print('Finished.')
- 由上述代码也可以看出这里的每一个将要分别写入excel的数据框是独立的。但是我是想从一个excel中的多的sheet提取,然后处理后再次写入excel。
# -*- coding: UTF-8 -*-
#导入所需模块
import xlrd
import numpy as np
import pandas as pd
from pandas import DataFrame
from openpyxl import load_workbook
excel_name = r'C:\4_stepSHIYAN\shiyan222.xlsx' #表格地址+表格名
wb = xlrd.open_workbook(excel_name) # 获取workbook中所有的表格
sheets = wb.sheet_names()
print (sheets)
# 循环遍历所有sheet
#alldata = DataFrame()
for i in range(len(sheets)):
df = pd.read_excel(excel_name, sheet_name=i, index=False, encoding='utf8')
df.sort_values("POINTID", ascending=True, inplace=True)
print (df) #查看dataframe
###保存为新的sheet,首先新建sheet
with pd.ExcelWriter(r'C:\4_stepSHIYAN\new.xlsx' ,engin='openpyxl') as writer :
for j in range(3):
name = "sheet"+ str(j)
df.to_excel(writer,sheet_name= name )
print ('处理完成!')
##########上述代码跑到第二个for语句时,实际只是对于i内容的两次存储。并没真正实现i1、i的单独存储
未解决疑问——如何实现从excel里读取出来的多个sheet处理后再次写入另一个excel的多个sheet???
- 但是对于自己的最终目标,可以直接将处理完的sheet拼接起来后再写入一个sheet中!!
# -*- coding: UTF-8 -*- #导入所需模块 import xlrd import pandas as pd from pandas import DataFrame from openpyxl import load_workbook excel_name = r'C:\4_stepSHIYAN\shiyan222.xlsx' #表格地址+表格名 wb = xlrd.open_workbook(excel_name) # 获取workbook中所有的表格 sheets = wb.sheet_names() print (sheets) # 循环遍历所有sheet alldata = DataFrame() for i in range(len(sheets)): df = pd.read_excel(excel_name, sheet_name=i, index=False, encoding='utf8') df.sort_values("POINTID", ascending=True, inplace=True) #对sheet内容按照第一列-POINTID-排序、inplace=True 将排序之后的数据直接替换原来的数据框(默认为False,False时,那么原来顺序没变,只是返回的是排序的)、ascending=True默认True升序排列;False降序排列 alldata = alldata.append(df) ##拼接 #查看dataframe #print alldata #保存为新的sheet,首先新建sheet,合并后的数据保存到新sheet中 writer = pd.ExcelWriter( r'C:\4_stepSHIYAN\shiyan222.xlsx' ,engin='openpyxl') book = load_workbook(writer.path) ####作用? writer.book = book #利用dataframe.to_excel保存合并后的数据到新的sheet alldata.to_excel(excel_writer=writer,sheet_name="ALLDATA")#生成新的sheet命名为ALLDATA writer.save() writer.close() print ('处理完成!')