python读取txt文件中没有对齐的一列的数据

  • 数据
  • 可以发现文本的最后一列数据是由几个单独的字符串构成,那么如何读取呢?

代码

with open(filename,"r") as f:
    data = []
    label = []
    # 按行读取数据
    for line in f.readlines():
        new_line = line.strip()  # 去除尾部的\n
        data.append(new_line)
        array = c_array[-1].split('\t')  # \t表示tab键,去除tab键空格
        label.append(array[-2]+' '+array[-1])
                             
    print('data:',data)
    print('label:',label)

 解释:

(1)因为按行读取文本数据,会附带将行末的换行符“\n”读进去,因此需要strip()函数去除换行符。

(2)第一行的读取结果如图所示,可以发现每一行四个元素之间以制表符隔开,因此使用split()函数将四个元素提取出来。但是,split的结果却是将四个元素生成了五个元素,观察输入文本发现,split将每行的最后一个元素中的一个空格键误认为tab键进行分割了。这点不知道是什么原因,但是针对文本,可以将生成的array数组中的倒数两个数重新连接,便还原了原始元素。

该文本的最终输出结果是

 剔除重复的,可以set一下,结果如下

print(set(label))
{'normal no lenses', 'normal hard', 'reduced no lenses', 'normal soft'}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值