
自然语言处理
文章平均质量分 73
yin5627
这个作者很懒,什么都没留下…
展开
-
基于正向最大匹配算法的分词算法
1.算法描述:最大匹配算法主要包括正向最大匹配算法、逆向最大匹配算法、双向匹配算法等。 其主要原理都是切分出单字串,然后和词库进行比对,如果是一个词就记录下来,否则通过增加或者减少一个单字,继续比较,一直还剩下一个单字则终止,如果该单字串无法切分,则作为未登录处理。而本组采用的是正向最大匹配算法,假设分词词典中的最长词的字数为 M,令其作为最大匹配系数。假设读取的汉字序列字数为 L,判断原创 2017-10-14 08:55:13 · 3460 阅读 · 0 评论 -
java正则表达式!正则表达式踩坑!!!
java正则表达式java正则表达式套路:String content = "你好你好啊!!!啊!!!";String pattern = ".*?";List list = new ArrayList();Pattern p = Pattern.compile(pattern);Matcher m = p.matcher(content);while(m.find()){原创 2017-12-03 00:01:44 · 560 阅读 · 0 评论