python
py_mxy
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘经典算法复现:朴素贝叶斯
原理: P(Ci|W) = P(w1w2…wn|C)P(Ci) / P(W) Ci为类别原创 2017-03-14 22:24:25 · 600 阅读 · 0 评论 -
正则表达式:前瞻,后顾,负前瞻,负后顾
前瞻: exp1(?=exp2) 查找exp2前面的exp1 后顾: (?<=exp2)exp1 查找exp2后面的exp1 负前瞻: exp1(?!exp2) 查找后面不是exp2的exp1 负后顾: (?<!exp2)exp1 查找前面不是exp2的exp1 import re # pattern = re.compile('(?<!左上)腹痛') print(re.find...原创 2019-05-05 11:49:30 · 1387 阅读 · 0 评论 -
同一项目中不同模块调用不同词典的jieba分词的方法
问题描述: 模块A使用了基于词粒度的深度学习模型,训练的过程是独立的并没有放进项目环境中,而在本项目的其他模块中加入了自定义字典,导致项目jieba分词的词典环境与模型独立训练过程中的环境不同,一个query进来模型拿不到与训练过程中同样的分词结果,所以结果与预期有出入。 解决方法: #新建一个分词器,使该分词器与模型训练过程中有相同的自定义字典 import jieba tokenizer1 =...原创 2019-05-08 16:51:41 · 804 阅读 · 0 评论
分享