今天做了一个文本处理的小脚本,脚本的要求是能够自够筛选特定的几行。
我一开始是整个读取的但在匹配的过程中,发现自己的程序问题很大,有时匹配的结果找不到,有的时候执行一遍后就结束了。总结后发现是自己的if else的问题,在做一个判断后自己的一个break 直接跳出了程序,所以用else 时要谨慎些,是否会因为异常直接导致程序的运行失败。
还有就是正则表达式的“^” 的使用,用来标记是否是行首。列表到字符串的转换''.join() 就可以使列表转换成字符串。因为查看列表时,列表内数据是16进制的,需要转换。
“\xe6\xb7\xb7\xe5\x87\x9d\xe5\x9c\x9f” 这是16进制的内容。
re 模块中findal可以遍历所有,而srearch却不是这样。要注意区分 search match 的具体区别。这很重要。