python的正则匹配

本文详细探讨了Python中的正则表达式,包括基本语法、常用元字符、模式匹配、搜索与替换以及在实际问题中的应用案例,帮助读者掌握高效处理文本数据的技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

def FilterTranslate(source):
    source.encode()
    temp = source
    xx = u"([\s\u30a0-\u30ff\u3040-\u309f\u4e00-\u9fa5\u3000-\u303f\ufb00-\ufffd\u0030-\u0039\u0041-\u005a\u0061-\u007a]+)"
    #日文 片假名 日文 片假名 中文 标点符号 数字 大写字母 小写
    pattern = re.compile(xx)
    results = pattern.findall(temp)
    fina = ""
    for result in results:
        fina += result
    return fina
正则说明
sub(pattern,repl,string)把字符串中的所有匹配表达式pattern中的地方替换成repl
[^**]表示不匹配此字符集中的任何一个字符
\u4e00-\u9fa5汉字的unicode范围
\u0030-\u0039数字的unicode范围
\u0041-\u005a大写字母unicode范围
\u0061-\u007a

小写字母unicode范围

\uAC00-\uD7AF韩文的unicode范围
\u3040-\u31FF日文的unicode范围

\x80-\xff

非ansi
\u4e00-\u9fa5中文
\uac00-\ud7ff韩文
\u30a0-\u30ff日文 片假名
\u3040-\u309f日文 平假名
\u3000-\u303f\ufb00-\ufffd标点符号

pyre

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值