【python】csv、xls、xlsx、txt、pkl数据处理

最新推荐文章于 2024-07-06 02:04:11 发布

原创最新推荐文章于 2024-07-06 02:04:11 发布 · 1.5k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言

python 专栏收录该内容

1 篇文章

订阅专栏

本文详细介绍了Python中处理不同格式数据文件的方法，包括csv、xls、xlsx、txt和pkl。对于csv文件，使用csv库进行读写操作；xls文件则借助xlrd和xlwt库；xlsx文件通过openpyxl模块；txt文件的读写操作简单直接；pkl文件的处理依赖于pickle库。文章提供了详细的代码示例，涵盖了文件的读取、写入及数据操作等关键步骤。

部署运行你感兴趣的模型镜像

csv文件

字符分隔值，其文件以纯文本形式存储表格数据（数据和文本）
用字符进行分割，不一定时逗号。

文件读取

利用csv库进行文件的读取，import csv，使用库中提供的函数进行文件的读写：

import csv
with("文件名.csv") as f:
    f_csv = csv.reader(f)
    #获取header
    header = next(f_csv)
    for row in f_csv:
        print(row)

reader返回一个迭代对象，首先获取表格的头，也就是属性（列表形式），直接for循环得到每一行数据（列表形式）。
补充：iter（）函数可以创建迭代对象，迭代器是一个可以记住遍历位置的对象。

也可以使用DictReader（），读出的数据以字典形式输出。

文件写入

import csv
#创建header
header = ['','','']
#数据
data = [['','',''],['','','']]
with open("文件名.csv",mode='w',encoding="utf-8",newline="") as f:
    writer = csv.write(f)
    #一次写入一行，写入header
    writer.writerow(header)
    #一次写入多行
    writer.writerows(data)

xls文件

对表格数据进行操作吧！
用到的库：xlrd（读）、xlwt（写）

文件读取

用到了xlrd库

import xlrd
#获取工作簿对象
workbook = xlrd.open_workbook("文件名.xls")
#获取sheet
sheet_names = workbook.sheet_name()
sheet1 = workbook.sheet_by_index(0)
#sheet1 = workbook.sheet_by_name("sheet1名字")

#操作表
rows = sheet1.nrows
cols = sheet1.ncols

#读出数据
datas = []
for i in range(rows):
    datas.append(sheet1.row_values(i))
#列：sheet1.col_values(i)
#单元格：sheet1.cell_value(0.0)

文件写入

用到了xlwt库

import xlwt
#创建工作簿
workbook = xlwt.workbook(encoding="utf-8")
#创建sheet
sheet1 = workbook.add_sheet('sheet1')
sheet1.write(0, 0, '输入数据')
#保存
workbook.save("文件名.xls")

xlsx文件

使用openpyxl模块来操作xlsx文件的数据

读取

import openpyxl
workbook = openpyxl.load_workbook("文件名.xlsx")
#获取所有sheet名字
sheet_names = workbook.sheetnames
sheet1 = workbook[sheet_names[0]]
#sheet1 = workbook["sheet名字"]
#sheet1 = workbook.worksheets[0]

#统计行数和列数
rows = sheet1.max_row
cols = sheet1.max_column

#读出数据
datas = []
for row in sheet1.rows:
    data = []
    for cell in row:
        data.append(cell.value)
    datas.append(data)
#整行读，获取到某行的tuple对象
#for row in list(sheet1.rows)[0]
#单元格：sheet1['A1'].value/sheet1.cell(1,1).value

补充：sheet1.rows得到的是一个生成器，每个数据以元组类型存储。

txt文件

#按行读
with open('data.txt', 'r') as f:
    data = f.read()
data = data.split('\n')
#写
with open('data.txt', 'a') as f:
    f.write('data')

pkl文件

import pickle
with open('data.pkl', 'rb') as f:
    data = pickle.load(f)

f = open('data.pkl', 'wb')
pickle.dump(data, f)
f.close()

参考：
https://blog.youkuaiyun.com/bryanwang_3099/article/details/119731390
https://blog.youkuaiyun.com/sinat_28576553/article/details/81275650?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-81275650-blog-120823417.pc_relevant_multi_platform_whitelistv4&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-81275650-blog-120823417.pc_relevant_multi_platform_whitelistv4&utm_relevant_index=2

您可能感兴趣的与本文相关的镜像

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本