一个大excel文件,比如想要按每10000行进行分割,可按如下思路,获取总行数,总行数除以10000,求得商和余数,比如总行数249765,商分别是24和9765,即总文件数是24,最后一个文件行数是9765.
前23个文件用for循环实现,最后一个文件单独导出
代码如下:
import pandas as pd
fn='客户信息(1).xlsx'
df=pd.read_excel(fn)
r=df.shape[0] #总行数
a1,a2=r//10000,r%10000 #文件个数,最后一个文件的行数
for i in range(0,a1-1):
d=df.iloc[i*10000:i*10000+10000,:]
d.to_excel(str(i+1)+'.xlsx',index=False)
d=df.iloc[len(df)-a2:len(df),:] #获取最后一个文件的行索引
d.to_excel(str(i+2)+'.xlsx',index=False) #文件保存