利用pandas自动化提取excel岩心数据

本文介绍了一个Python脚本,使用pandas和openpyxl库从Excel文件中批量提取岩心数据,通过确定固定下标避免正则化,针对每个sheet循环提取并合并数据到一个新的Excel工作簿中。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文章目录

代码展示:

该代码主要用于简单的批量提取excel中,岩心数据,因为重复度高,所以没有使用正则化去自动提取,先是确定固定的下标,然后通过下标来提取每一口井的岩心数据。

#导入pands包,用来读取excel数据
#导入load_workbook包,用来对excel写入数据
import pandas as pd
import numpy as np
from openpyxl import load_workbook

def append_add(A,B):
    """将数组拼接"""
    C = np.append(A,B)
    return C
def dic1(j):
'''确定要提取的属性'''
    if j == 1:
        a =np.array(data.loc[5,0])
        b =np.array(data.loc[6:13,0])
        c =np.array(data.loc[6:13,7])   
#         ff=np.array(data.loc[5:10,14].dropna(axis=0))
    return a,b,c
#写入数据
df=pd.DataFrame()#构造原始数据文件
df.to_excel('3.xlsx')

j=1

for i in range(2,1000):
'''遍历每一个sheet,从而提取该sheet上对应的值'''
    
    data = pd.read_excel("NB19-6-5Sa井高压压汞分析报告(10个岩心).xlsx",sheet_name=i,header=None,index_col=False)
#     print(data)
    a =np.array(data.loc[5,1])
    b =np.array(data.loc[6:13,3])
    c =np.array(data.loc[6:14,11])    
    
    A=[] #设置一个空列表
    if j==1:
        aa,bb ,cc= dic1(j)
        sum_and=[aa,bb,cc,a,b,c]
        for i in sum_and:
            A = append_add(A,i)
        j=j-1
        A = A.reshape(2,-1).T
    else:
        A=[]
        sum_and = [a,b,c]
        for i in sum_and:
            A = append_add(A,i)
    
    A = pd.DataFrame(A)    
    
    #要写入的数据
    df1 = pd.DataFrame(pd.read_excel('3.xlsx')) 
    df_row = df1.shape[1] 
    
    with pd.ExcelWriter('3.xlsx',mode='a') as writer:
        book = load_workbook('3.xlsx')
        writer.book = book
        writer.sheets = dict((ws.title, ws) for ws in book.worksheets)
        A.to_excel(writer,sheet_name='Sheet1',index=False,header=False,startcol=df_row)
        print(df_row)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值