import pandas as pd
import os
path = (r'G:\命名完成的照片')
file = os.listdir(path)
barcodes = []
collectsns = []
photos = []
for i in file:
barcode = i[:10]
collectsn = i[11:21]
photo = i[:23]
barcodes.append(barcode)
collectsns.append(collectsn)
photos.append(photo)
photodata = pd.DataFrame({'标本条形码': barcodes, '采集号': collectsns, '照片': photos})#获取文件中照片中的数据
frame = pd.read_excel('照片录入.xlsx', '南昌大学')
filedata = frame[['标本条形码', '采集号', '照片']][2:]#获取表格中的数据
finaldata = filedata.combine_first(photodata) # 后一个数据补齐前一个数据
两个dataframe之间的拼接
最新推荐文章于 2024-04-05 17:14:31 发布
该博客主要展示了如何使用Python进行数据处理。通过`os`和`pandas`库,作者读取了一个包含照片信息的文件夹,并将文件名拆分为条形码、采集号和照片名称。然后,从Excel表格中读取类似数据,并使用`combine_first`方法将两者数据进行合并,以确保数据的完整性。此过程适用于数据预处理和信息整合场景。
456

被折叠的 条评论
为什么被折叠?



