CSV,逗号分隔值(Comma-Separated Values,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。
txt生成csv
还是要根据txt中的内容来设计编码部分,我读取的txt格式是有xy两个坐标,分别存在两个txt文件,坐标一 一对应。
[4. 2. 7. 2. 3. 0. -7. 8. 4. 4. -1. 8. 2. 6. -2. -3. -3. -1.
50. 4. 4. 9. 3. 3. 2.]
import os
import pandas as pd
def line_to_list(file):
data_list = []
lines = (line.strip() for line in file)
for line in lines:
line = line.strip('[] ')#掐头去尾
temp = line.split('.')
for t in temp:
if t != '':
num = int(t.strip())
data_list.append(num)
return data_list
def txt_to_csv(path):
x_file = open(path + '-x.txt')#这里xy是实际的使用场景
y_file = open(path + '-y.txt')
x_list = line_to_list(x_file)
y_list = line_to_list(y_file)
txt_list = list(zip(x_list,y_list))
column_name = ['X', 'Y']
txt_df = pd.DataFrame(txt_list, columns=column_name)
return txt_df
def main():
for i in range(0,19):
txt_path = os.path.join(os.getcwd(), ('root\\data-' + str(i) ))#txt路径
txt_df = txt_to_csv(txt_path)
txt_df.to_csv(('root\\data\\result-'+str(i).rjust(2,'0')+'test.csv'), index=None)#按01、02、03这样命名
print('Successfully converted txt to csv.')
main()
json转换xml
之前转化label的时候用到了json-to-xml,参考了https://blog.youkuaiyun.com/u013066730/article/details/103007285/,在其基础上进行了一点魔改(适用于需要修正字段的转换)
import os
from tqdm import tqdm
from read_json_anno import ReadA