查找每行的第一个汉子
(?:^|\n)[\x{4e00}-\x{9fa5}]
删除每行仅有两位字符
(?:^|\n)[\x{4e00}-\x{9fa5}][\x{4e00}-\x{9fa5}]$
删除空行
\r^$
正则表达式在文本处理中的应用,
该文介绍了如何使用正则表达式查找每行的第一个汉字,删除只有两个汉字的行以及去除空行,是关于文本清洗和处理的技术教程。
查找每行的第一个汉子
(?:^|\n)[\x{4e00}-\x{9fa5}]
删除每行仅有两位字符
(?:^|\n)[\x{4e00}-\x{9fa5}][\x{4e00}-\x{9fa5}]$
删除空行
\r^$
1042

被折叠的 条评论
为什么被折叠?