python读写各种格式文件

前言

 本篇博文主要记录一些常见的文件读取操作,不定期更新扩充。


1 读写txt

import os
# 读
def read_txt(path):
    with open(path,'r') as f:
        while True:
            line = f.readline()      # 读取整行数据
            if not line:
                break
            imgsets.append(line.strip()) # 必须放在 if 之后,否则会多读入一个空字符。
        # 或者
        lines = f.readlines()
        for line in lines:
        	imgsets.append(line.strip())
    #f.close() # f.close不用加,因为Python自动默认将操作系统的待写入的文件写到了磁盘里面。
# 写
def write_txt(path):
    with open(path,'w') as f:
        f.write('wulele\n')
    #f.close() # 和上面同理,with方法保证了 操作系统自动将文件完全写入磁盘了。
if __name__ == '__main__':
    # read
    read_path = '/home/wujian/MMLAB/gallery_content.txt'
    read_txt(read_path)
    # write
    write_path = '/home/wujian/MMLAB/save.txt'
    write_txt(write_path)

2 读写xml文件

import xml.etree.ElementTree as ET
def save_to_new_annotations(img,path):
    doc = ET.parse(path)
    root = doc.getroot()
    width,height,_ = img.shape

    for size in root.findall('size'):
        size.find('width').text = str(width)
        size.find('height').text = str(height)

    f = 'E:/RotateVocDataset/VOCdevkit/VOC2007/NewAnnotations/000005.xml'
    doc.write(f,encoding="utf-8")                         #重新写入参数文件
    print('Done!')

def read_annotation(path):
    root = ET.parse(path).getroot()
    sizes = []
    filename = root.find('filename').text   # text后无括号
    # 获取图像的尺寸
    for size in root.findall('size'):
        width = size.find('width').text
        height = size.find('height').text
        channel = size.find('depth').text
    sizes.extend([width,height,channel])
    # 获取物体信息
    imdbs = []
    for obj in root.findall('object'):
        imdb = []
        label = obj.find('name').text
        bbox = obj.find('bndbox')          # 由于bndbox非叶子节点,所以不能直接.text
        xmin = bbox.find('xmin').text      # 获取bbox的信息
        ymin = bbox.find('ymin').text
        xmax = bbox.find('xmax').text
        ymax = bbox.find('ymax').text
        imdb.extend([xmin,ymin,xmax,ymax,label])
        imdbs.append(imdb)
    return sizes,imdbs

if __name__ == '__main__':
    img_path= 'E://RotateVocDataset/VOCdevkit/VOC2007/JPEGImages/000001.jpg'
    anno_path = 'E://RotateVocDataset/VOCdevkit/VOC2007/Annotations/000001.xml'
    img=cv2.imread(img_path)
    height, width ,_ = img.shape
    size, imdbs = read_annotation(anno_path)
    print(size,'\n',imdbs)

3 读写json文件

json最大好处就是能够存储python的数据结构,即写进去是dict,读出来依旧是dict,所以大多数数据集都喜欢以json进行保存。而其中用到的主要api是:json.dumps(), json.loads()。

root_dir = '/mnt/data/VOC2017/train/'
sjs  = root_dir + 'coco_hoi_train2017.json'
# 写入json
with open(sjs, 'w') as f:
    #f.write(str(annot) + '\n')             # 写的方法会破坏python的数据结构
    f.write(json.dumps(content) + '\n')     # json.dumps 就能保存python的数据结构
# 读取json
with open(json_path,'r') as f:
    lines = f.readlines()
    for line in lines:
        content = json.loads(line.strip())
        print(content['img'], content['label'])
        break

4 命名/拷贝移动文件

filename.zfill(6)  # 字符串填充6位,右对齐。

shutile.copyfile

总结

 没啥可总结的…

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值