(2)长间隔符文本的转换与读取

本文介绍了一种处理文本数据中复杂分隔符的方法,通过将多分隔符|@|转换为单分隔符@,解决了pandas读取数据时的混乱问题,确保了数据的整洁。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import pandas as pd
import numpy as np
import os
os.listdir()
['.ipynb_checkpoints', 'Untitled.ipynb', '文本数据.txt']
wenben = pd.read_table("./文本数据.txt",sep="@",engine="python",encoding="utf8")
wenben

在这里插入图片描述
需求:我们可以看到,该数据读取出来的时候身边都出现了"|“符号,不过read_table函数读取文本的时候只能使用单间隔符,所以我们需要考虑将数据中的多间隔符”|@|“转换为单间隔符”@"

with open ("./文本数据.txt","r",encoding="utf8") as fpr:
    content = fpr.read()
    content = content.replace("|@|","@")
fpr.close()
with open ("./文本数据1.txt","w",encoding="utf8") as fpw:
    fpw.write(content)
fpw.close()
# 查看当前路径下的文件
os.listdir()
['.ipynb_checkpoints', '文本数据.txt', '文本数据1.txt', '长间隔符文本的转换与读取.ipynb']
# 再一次读取文件
wenben1 = pd.read_table("./文本数据1.txt",sep="@",engine="python",encoding="utf8")
wenben1

在这里插入图片描述
可以看到再次读取的数据就很干净整洁了

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值