将txt文件转化为csv文件

在爬虫项目中,为了方便后期预处理,博主计划将已爬取的txt数据转换为csv格式。文章讲述了如何读取txt文件,剔除非必要数据,提取所需行并存储为csv的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这两天在写爬虫,但由于前期只想将数据保存下来就行,后期直接进行预处理就行,但突然发现在批量预处理时txt文件明显比不上csv格式,所以我需要将我已经爬取的txt文件保存为csv格式。

这是读取txt文件,并将每行不需要的数据给剔除掉,因为爬虫时有很多的空数据没有处理

    for line in f.readlines():
        #    print (line)
        l.append(str(line))
        while '\n' in l:
            l.remove('\n')
        while '                                            \n' in l:
            l.remove('                                            \n')
        while '                                                \xa0\n' in l:
            l.remove('                                                \xa0\n')
    f.close()
    print("len=", len(l))

这段是提取出我需要的行单独保存,并将提取的数据保存单独的数组

    
    for i in range(len(l) - 1):
        if "景色:" in l[i]:
            one = l[i][55:-2]
            two = l[i + 1][55:-2]
            three = l[i + 2][56:-2]
            t
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值