这是我攒的一些代码总结,来源已经记不清了。我觉得简单易懂,只要用过python就行。
# author: 峥嵘之舟
# ide:vsc
# description:涉及深度学习的数据加载,用 csv和pandas来操作csv文件
# 容易遇见的坑:文件名命名为csv.py。不然在import pandas会报错
# 先加载python内置库
import os
import csv
import random
# 后加载外库
import pandas as pd
# 写csv文件
def write_csv():
# 创建csv
csv_file = open('my_train.csv', 'w')
writer = csv.writer(csv_file)
# 写入列
writer.writerow(['id', 'has_forest'])
forest_dir = 'data/2750/forest_copy'
no_forest_dir = 'data/2750/non-forest'
forest_images = os.listdir(forest_dir)
no_forest_images = os.listdir(no_forest_dir)
# print(len(forest_images))
# print(len(no_forest_images))
all_data = []
for img in forest_images:
all_data.append([img, 1])
for img in no_forest_images:
all_data.append([img, 0])
random.shuffle(all_data)
# 写入多行用
write