import re
def find_chinese(file):
pattern = re.compile(r'[^\u4e00-\u9fa5]’)
chinese = re.sub(pattern, ”, file)
print(chinese)
def find_unchinese(file):
pattern = re.compile(r'[\u4e00-\u9fa5]’)
unchinese = re.sub(pattern,””,file)
print(unchinese)
if __name__ == “__main__”:
line = “2019年1月3日 – python去除空格和换行符的方法 一、去除空格 strip().strip() # …用replace(‘\’,”),后边的串替换掉前边的posted @ 2016-07-18 08:53 …”
print(“原文:”)
print(line)
print(“保留中文:”)
find_chinese(line)
print(“保留非中文:”)
find_unchinese(line)
————————————————
版权声明:本文为优快云博主「bailixuance」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.youkuaiyun.com/bailixuance/java/article/details/89555580
该博客主要介绍了使用Python去除字符串中所有中文的方法。通过定义`find_chinese`和`find_unchinese`函数,利用正则表达式分别实现保留中文和保留非中文的功能,并给出了示例代码及运行结果。

被折叠的 条评论
为什么被折叠?



