假设我们的data数据是这样的,

现在需要删除每一行两端的空格,并且提取含有非法标识符(如倒数第二行含有#)的一行
# -*- coding: utf-8 -*-
with open("D:\\...\\data.txt","r") as fr,open("D:\\...\\new.txt","w") as fw:
for line in fr.readlines():
line = line.strip() #strip()方法用于移除字符串头尾指定的字符(默认空格或换行符)
fw.write(line+"\r") #“\r”是换行,光标在上一行;“\n” 是回车,光标在下一行
with open ("D:\\...\\new.txt","r") as f:
for line in f.readlines():
#excep = [i for i in line if not str.isdigit(i)]#每一行含有非数字,就进行赋值操作
excep = [i for i in line if i not in '\n .0123456789']#这里是为了提取图片倒数第二行,字符串可以写入自己想过滤的内容
if (len(excep)!=0):
print(excep)
文本处理与异常行检测
本文介绍了一种从文本文件中去除空白字符并检测含有非法标识符行的方法。通过使用Python的strip()方法来移除每行首尾的空格,并采用特定条件筛选出包含非法字符的行,此过程有助于数据预处理和异常检测。
1311

被折叠的 条评论
为什么被折叠?



