直接上代码:
# -*- coding: utf-8 -*-
# @Time : 2019-12-18 10:21
# @Author : Monster-H7
import os
import csv
import re
# 要读取的文件的根目录
root_path ='E:\PycharmProjects\l'
# 将所有目录下的文件信息放到列表中
def get_Write_file_infos(path):
# 文件信息列表
file_infos_list = []
# 遍历并写入文件信息
for root, dirnames, filenames in os.walk(path):
for filename in filenames:
file_infos = {}
dirname = root
dirname = re.findall(r'val\\(.+)',dirname)
#正则表达式来截取文件夹名称
#正则表达式还得学习
filename1 = filename.split('.jpg')[0]
file_infos["file"] = filename1
file_infos["species"] = dirname[0]
# file_infos["图片"] = ''
# 将数据追加字典到列表中
file_infos_list.append(file_infos)
return file_infos_list
# 写入csv文件
def write_csv(file_infos_list):
with open('1.csv', 'a+', newline='') as csv_file:
csv_writer = csv.DictWriter(csv_file, fieldnames=['file', 'species'])
csv_writer.writeheader()
for each in file_infos_list:
csv_writer.writerow(each)
# 主函数
def main():
# 调用获取文件信息的函数
file_infos_list = get_Write_file_infos(root_path)
# 执行写入程序
write_csv(file_infos_list)
# 主程序入口
if __name__ == '__main__':
main()
本文介绍了一个Python脚本,用于从指定路径下的所有文件中批量提取信息,并将这些信息整理为列表,最终以CSV格式进行保存。该脚本使用了正则表达式来精确匹配文件夹名称,确保数据的准确性和一致性。
1036

被折叠的 条评论
为什么被折叠?



