python中从字符串中截取中文和英文字符

这篇博客介绍如何在Python中使用正则表达式从字符串中截取中文和英文字符。通过示例展示了如何截取中文字符,并计算两个字符串中中文字符的差异和重叠部分。此外,还提到了将字符串快速转换为字符集合的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# -*- coding: utf-8 -*-
#encoding=utf8
import os,sys,re
#
# test_str1='蒙派克E'
#
# test_str2='新ABC蒙派克'
#
# test_s1 = test_str1.decode('utf-8')
# test_s2= test_str2.decode('utf-8')
#
# pat_1 = re.compile(ur'[\u4e00-\u9fa5]') #这里是关键,
#
# s1_zhongwen=''
#
# s2_zhongwen=''
#
# for item in re.findall(pat_1,test_s1): #这里截取出中文字符
#     # print item
#     s1_zhongwen=s1_zhongwen+item
#     print s1_zhongwen
#
# for item in re.findall(pat_1,test_s2):
#     s2_zhongwen=s2_zhongwen+item
#     print s2_zhongwen
#
# for item in (set(s1_zhongwen)-set(s2_zhongwen))|(set(s2_zhongwen)-set(s1_zhongwen)):
#     print item
 #计算到两个车型的中文名称的重叠度。
 # print pat_1.split(test_s2)#这里截取出非中文的字符 


以及,快速的把字符串,变成各个单个字符元素组成的集合的方法

# tl1=[1,3,5,'abc']
#
# tl2=[3,4,5]
#
# tl3=[5,9]
#
#
#
# test_set=set(tl1) | set(tl2) | set(tl3)
#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值