python中文分字英文分词程序

def wordSeg(str):
   english = 'abcdefghijklmnopqrstuvwxyz0123456789'
   output = []
   buffer = ''
   #str=str.lower()
   for s in str:
      if s in english or s in english.upper(): #英文或数字
         buffer += s
      else: #中文
         if buffer:
            output.append(buffer)
         buffer = ''
         output.append(s)
   if buffer:
      output.append(buffer)
   return output

str = '我叫Xiaoming,来自山东,今年2岁了,今天星期一,大家早上好,Good morning'
print(wordSeg(str))
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值